Está en la página 1de 201

Anlisis Multivariante en la Investigacin Comercial

Asignatura: Investigacin de Mercados II Centro: Universidad Autnoma de Madrid

...............................................................................................1 TEMA 1: EL ANALISIS MULTIVARIANTE EN INVESTIGACION COMERCIAL...............................................................................4 Introduccin..............................................................................................4 Definicin del AM......................................................................................4 Diseos y conceptos bsicos del AM........................................................5 Tratamientos previos de los datos. ..........................................................9 upuestos del AM...................................................................................!! "lasificacin de los m#todos del AM.......................................................!$ %ro&ramas Informticos..........................................................................!4 '(ercicio !...............................................................................................!4 TEMA 2: EL ANALISIS FACTORIAL..............................................16 Definicin y ob(etivo del A). ..................................................................!* "onceptos bsicos..................................................................................!+ Distincin entre A) y A"%.......................................................................!, upuestos del A"%. - on espec.ficos del A"%/........................................!9 Diseo del A"%. -%rocedimientos/...........................................................01 "aso practico..........................................................................................05 Tratamiento de los datos con D2A3' y % .........................................$, '(ercicio 0...............................................................................................45 TEMA 3: EL ANALISIS FACTORIAL DE CORRESPONDENCIAS ........50 Introduccin............................................................................................51 Definicin y ob(etivo del A)". ................................................................5! "onceptos bsicos del A)".....................................................................50 upuestos del A)". ................................................................................5$ Diseo del A)"........................................................................................5$ "asos prcticos con D2A3'....................................................................54 '(ercicio $...............................................................................................*5 TEMA 4: EL ANALISIS CLUSTER.................................................69 Introduccin............................................................................................*9 Definicin y ob(etivo del A"....................................................................+1 "onceptos bsicos del A".......................................................................+1 upuestos del A". ..................................................................................+1 Diseos del A"........................................................................................+0 "asos prcticos con D2A3'....................................................................+* '(ercicio 4...............................................................................................++ TEMA 5: LA REGRESIN MULTIPLE............................................82 Introduccin............................................................................................,0 Definicin y ob(etivo de la 4M................................................................,4 T#rminos y conceptos bsicos de la 4M.................................................,5 upuestos de la 4M. ..............................................................................,, Tamao muestral....................................................................................,9 Diseo de la 4M......................................................................................,9

"asos prcticos con D2A3' y % ........................................................91 Anlisis de upuestos de la 4M............................................................!14 '(ercicio 5.............................................................................................!!* TEMA 6: EL ANLSIS DISCRIMINANTE......................................119 Introduccin..........................................................................................!!9 Definicin y ob(etivo.............................................................................!01 "onceptos y t#rminos bsicos del AD...................................................!01 upuestos del AD..................................................................................!0$ Diseo del AD.......................................................................................!0$ "asos prcticos.....................................................................................!04 '(ercicio *.............................................................................................!55 TEMA : EL ANLSIS !"#$%&'(%')$* +* #' &'(%'),' -MANOVA.....160 Introduccin..........................................................................................!*1 Definicin y ob(etivo.............................................................................!*0 T#rminos y conceptos bsicos del MA356A.........................................!*4 upuestos bsicos del MA356A. .........................................................!*9 Diseo del estudio con el MA356A......................................................!+1 "asos prcticos con % .....................................................................!+! '(ercicio +.............................................................................................!,0 TEMA 9: LA REGRESIN LOG/STICA -MODELO LOGIT.................18 Introduccin..........................................................................................!,+ 5b(etivo de la 47..................................................................................!,+ Modelo de la 47....................................................................................!,+ Diseo del estudio con la 47. ...............................................................!,, Medicin de la variable dependiente....................................................!,, 'stimacin del modelo.........................................................................!,, upuestos bsicos de la 47. ................................................................!,, 8ondad de a(uste..................................................................................!,9 Interpretacin de los resultados...........................................................!91 "omparacin de los modelos9 re&resin: discriminante y lo&it............!90 "asos prcticos con % .....................................................................!9$ '(ercicio 9.............................................................................................!99

TEMA 1: EL ANALISIS MULTIVARIANTE EN INVESTIGACION COMERCIAL

Estructura de la clase: 1. Introduccin. . !e"inicin del AM. #. !ise$os % conce&tos '(sicos del AM. ). Trata*ientos &re+ios de los datos. ,. Su&uestos del AM. -. Clasi"icacin de los *.todos del AM. /. 0ro1ra*as in"or*(ticos. Introduccin. En primer lugar, cuando queremos examinar un sistema complejo de actividades comerciales, muchas veces no es suficiente utilizar tcnicas univariantes y hay que ir al empleo del AM. Cuando el n mero de varia!les que influyen simult"neamente y de forma importante en el pro!lema que queremos tratar es elevado #no solamente una o dos, sino un n mero elevado de varia!les$, entonces tenemos que utilizar el AM. %e!emos reflexionar que ser&a mejor emplear' an"lisis univariante, an"lisis !ivariante o an"lisis multivariante. (i queremos analizar por separado varia!les utilizaremos el an"ilisis univariante y !ivariante. En el caso de necesitar un an"lisis en conjunto, emplearemos tcnicas multivariantes. Con esta tcnica determinaremos si las varia!les est"n influyendo en los grupos que estudiamos y por lo tanto nos sirve para analizar las relaciones m ltiples. (i queremos utilizar )analizar m ltiples varia!les simult"neamente, tenemos que utilizar tcnicas multivariantes. !e"inicin del AM. El AM se puede definir como' *as tcnicas estad&sticas utilizadas para tratar m ltiples varia!les que se de!en analizar simult"neamente, y cuyos efectos no tienen sentido si se interpretan por separado. (on las tcnicas estad&sticas que miden, explican y predicen relaciones entre m"s de dos varia!les cuando sus efectos no tienen sentido si se interpretan por separado. Valor terico' +Es el elemento esencial del AM,. Com!inaci-n de todas las varia!les. %e!emos sintetizar todas las varia!les en un solo valor te-rico. #Muchas veces hay que ponderar m ltiples varia!les de modo emp&rico$.

!ise$os % conce&tos '(sicos del AM. #%ise.o de una investigaci-n de mercados///flujo del AM2 *os pasos a seguir al realizar una investigaci-n se pueden resumir como sigue' !e"inir el o'3eti+o a tra+.s de un estudio &re+io. Esta'lecer las 4i&tesis. Seleccionar +aria'les % escalas. Esta'lecer la *etodolo15a 6instru*entos7 *uestreo7 etc.2 Seleccionar la t.cnica *ulti+ariante *(s a&ro&iada. !eter*inar el ni+el de si1ni"icacin 6al&4a2. Coleccionar datos. E+aluar los su&uestos '(sicos de la t.cnica *ulti+ariante. Esti*acin del *odelo *ulti+ariante % +aloracin del a3uste del *odelo. Inter&retar el +alor terico 6rec4a8ar o no las 4i&tesis2. Validacin e inter&retacin de los resultados. 0$ !e"inir el o'3eti+o a tra+.s de un estudio &re+io 1rimeramente, tenemos que determinar el o!jetivo del estudio. A continuaci-n, investigaremos la literatura existente para esta!lecer el estado del arte. %efinir para qu queremos realizar el tra!ajo' o!jetivos. 1ara ello analizamos los estudios realizados anteriormente so!re el tema. %eterminamos as& qu queremos realizar en el tra!ajo, es decir, justificar la pretensi-n del tra!ajo. +2ay dos cosas importantes Conocimiento y creatividad,. 2ay que esta!lecer un o!jetivo pero justificarlo a travs de la revisi-n !i!liogr"fica. 3$ Esta'lecer las 4i&tesis Esta!lecemos las hip-tesis que queremos validar o rechazar mediante el estudio. 4$ Seleccionar +aria'les % escalas %espus, tenemos que determinar el tipo de varia!les y escalas a emplear. *a pala!ra +varia!le, se refiere a una magnitud cuyos valores son o!jeto de estudio. Estos valores pueden tomar dos tipos !"sicos de datos, no mtricos #cualitativos$ o mtricos #cuantitativos$. (eg n el tipo de datos, tendremos que determinar el tipo de escalas que queremos utilizar para el estudio. 2ay cuatro tipos de escalas. Escalas 5ominal Caracter&sticas 6dentifica por categor&as mutuamente excluyentes *os n meros no tienen valor matem"tico 7rdenaci-n de las categor&as. *os n meros no dan informaci-n de la distancia

7rdinal

entre categor&as. 6ntervalo 6dentifica una distancia constante entre categor&as. 8iene un origen ar!itrario. 9az-n (e puede realizar comparaci-n proporcional entre categor&as. 8iene un origen a!soluto. A la hora de determinar las preguntas del cuestionario, tener en cuenta los cuatro tipos de escalas porque cada tcnica multivariante requiere un determinado tipo de varia!les #mtricas y no mtricas$. 9especto al primer tra!ajo, es aconseja!le incluir entre 0:/3; <atri!utos< que se puedan medir en una escala de intervalo que tenga : o = grados, para de esta manera poder utilizar el AC1 o el AC. 8am!in, os conviene incluir varia!les que se puedan medir en una escala nominal para poder utilizar el A>C. >inalmente, si incluimos varia!les mtricas con una escala de raz-n, tales como gastos mensuales #de una determinada marca, etc.$, ingresos, tiempo, etc., podremos utilizar algunas tcnicas de dependencia, por ejemplo, regresi-n m ltiple y an"lisis discriminante, para el segundo tra!ajo. 0ara con+ertir +alores no *.tricos en *.tricos:

%esacuerdo opiniones

Acuerdo

7rdenamos las

Escala de *i@ert' Con : grados, tam!in lo hay con = grados. (iempre es mejor tener m"s grados. Completamente en desacuerdo /3 M"s o menos en desacuerdo 5o sa!e, no contesta M"s o menos de acuerdo Completamente de acuerdo /0 ; A0 A3

?$ Esta'lecer la *etodolo15a 6instru*entos7 *uestreo7 etc.2 8ras seleccionar varia!les y escalas, ahora tendremos que esta!lecer la metodolog&a. :$ Seleccionar la t.cnica *ulti+ariante *(s a&ro&iada. %espus, seleccionaremos la tcnica multivariante m"s adecuada, y a continuaci-n, determinaremos el nivel de significaci-n.

B$ !eter*inar el ni+el de si1ni"icacin 6al&4a2. El nivel de significaci-n est" fuertemente relacionado con el llamado +error de medida,. %e!emos aumentar el nivel de significaci-n para aumentar el valor del estudio y para ello hay que disminuir el error de medida. Cuanto mayor nivel de significaci-n mejor. El error de medida es el grado en que los valores o!servados no son representativos de los valores verdaderos. #(e pueden cometer errores, no coincidiendo x con C$. El error de medida es importante porque cuando calculamos correlaciones o medias, normalmente el efecto verdadero est" parcialmente camuflado por este error de medida, causando la perdida de precisi-n. Es decir, la presencia del error de medida produce distorsiones en las relaciones o!servadas y de!ilita el poder de las tcnicas multivariantes. 1ara valorar el grado de error de medida, hay que considerar dos factores importantes, que son la fia!ilidad y la validez. -conceptos ;ue <ay ;ue incluir en traba(o/ *a "ia'ilidad es el grado en que la varia!le o!servada mide el valor verdadero y est" li!re de error. (i la misma medida se realiza muchas veces, las medidas fia!les llegar"n a los mismos resultados. *a fia!ilidad puede verse perjudicada por el error aleatorio. El error aleatorio es el sesgo transitorio que no es necesariamente idntico en todas las mediciones. Ejemplos de este tipo de error son errores de codificaci-n, sesgos de entrevistadores, caracteres de los entrevistados, etc. *a +alide8 se define como el grado en que la medida representa con precisi-n lo que se supone que representa. 1or ejemplo, si queremos medir los gastos en actividades de ocio, no preguntaremos por los gastos totales de las econom&as domsticas. *a validez puede verse perjudicada tanto por el error aleatorio como por el error sistem"tico. El error sistem"tico es el sesgo permanente en todas las mediciones. 1or ejemplo, errores en los &tems de la escala, ausencia de claridad en el cuestionario, etc. 1or ello, el investigador de!e minimizar el error de medida maximizando tanto la fia!ilidad como la validez del instrumento de investigaci-n.

8odas las tcnicas multivariantes, excepto el an"lisis cluster y el an"lisis multidimensional, se !asan en la inferencia estad&stica de los valores de una po!laci-n o la relaci-n entre varia!les de una muestra. (i estamos realizando un censo de toda la po!laci-n, entonces no tenemos que preocuparnos de la inferencia estad&stica por que lo que medimos es la media verdadera. 1ero muchas veces no podemos utilizar la po!laci-n total, y por lo tanto, nos vemos o!ligados a hacer inferencias de una muestra y aceptar el nivel de error estad&stico

1ara interpretar las inferencias estad&sticas, tenemos que determinar el nivel acepta!le de error estad&stico. (e tienen que esta!lecer hip-tesis nula 2o. (e suelen comparar las medias determinando que una o dos medias sean iguales o distintas. El modo de aproximaci-n m"s com n es determinar el nivel de error de 8ipo 6, que tam!in se llama alfa. El error de 8ipo 6 es la pro!a!ilidad de rechazar la hip-tesis nula cuando es cierta. 7 dicho de otra manera, la pro!a!ilidad de que la prue!a estad&stica muestre significaci-n estad&stica cuando en realidad no est" presente. Al determinar el nivel de error de 8ipo 6, tenemos que fijar tam!in el segundo tipo de error, que es el error de 8ipo 66 o !eta. El error de 8ipo 66 es la pro!a!ilidad de fallar en rechazar la hip-tesis nula cuando es realmente falsa. %icho de otra manera, nuestro o!jetivo es minimizar estos dos tipos de errores, el error de 8ipo 6 y 8ipo 66, y maximizar el nivel de confianza #0/alfa$ y la potencia #0/!eta$. 9ealidad %ecisi-n 9echazar 2; 5o rechazar 2;
Aceptar =1

Cierta Error 8ipo 6 D 1otencia 0/E

>alsa 5ivel de Confianza 0/D Error 8ipo 66 E

Error tipo 0 ' 1ro!a!ilidad de rechazar la 2o cuando a es cierta al tener que rechazarse cuando es falsa Error tipo 3' 1ro!a!ilidad en fallar en rechazar la 2o cuando es realmente falsa, es decir, no rechazar la 2o cuando es falsa. %e!emos minimizar estos dos tipos de errores y al mismo tiempo estamos maximizando el nivel de confianza y potencia. (i no tenemos el suficiente nivel de confianza y potencia, el estudio no tiene valor. Esta!lecer el nivel de significaci-n es importante y por ello, tenemos que seguir determinados pasos para poder determinarlo' a. Esta!lecer la 2o #2ip-tesis nula$ y la 20 #2ip-tesis alternativa$ !. Elegir la prue!a estad&stica c. >ijar el nivel de significaci-n #alfa$ d. Calcular estad&stico. e. (e compara el estad&stico calculado con el te-rico. (i es mayor se rechaza 2;. (i es menor no se rechaza 2o. =$ Reco&ilar datos F$ E+aluar los su&uestos '(sicos de la t.cnica *ulti+ariante.

G$ Esti*acin del *odelo *ulti+ariante % +aloracin del a3uste del *odelo. 0;$ Inter&retar el +alor terico 6rec4a8ar o no las 4i&tesis2. 00$ Validacin e inter&retacin de los resultados: -en el traba(o esta >ltima parte debe tener implicaciones para el mundo real. '(9 ? para ;u# sirven los resultados para la empresa: para la vida real@ AAAAlo valorar muc<o en el traba(o/

Trata*ientos &re+ios de los datos. Antes de procesar los datos es importante sa!er que hemos conseguido cumplir una serie de supuestos. Existen dos razones que explican la importancia de realizar un !uen an"lisis de los datos' / Cuanto m"s cuidado tengamos en analizar los datos, mejor ser" la predicci-n y podremos determinar m"s f"cilmente las relaciones entre las varia!les. / *as tcnicas multivariantes requieren muchos m"s datos y supuestos m"s complejos que las tcnicas univariante o !ivariantes. 2ay que ver si cumplen una serie de supuestos. Muchas veces los efectos del incumplimiento de los supuestos no se representan directamente en los resultados, sino que tienen un efecto importante so!re la naturaleza e interpretaci-n de los datos. Es fundamental o!servar las varia!les individualmente, pero tam!in hay que ver las relaciones entre las varia!les conjuntamente. 1ara ello. 2acemos los siguientes tratamientos' Examinar gr"ficamente los datos para sa!er la forma de la distri!uci-n, analizar las relaciones entre varia!les, y analizar las diferencias entre grupos. 8ratar datos ausentes mediante mtodos de imputaci-n %etectar casos at&picos y eliminarlos si no son aleatorios. E9a*inar 1r("ica*ente: 2ay que examinar la forma de la distri!uci-n y para ello podemos utilizar' 2istograma' 9epresentaci-n gr"fica de los datos que muestra la frecuencia de los datos en categor&as. Es una forma muy til de averiguar si existe una distri!uci-n normal, si los datos siguen una distri!uci-n normal. Es el primer mtodo de examen gr"fico. Hr"fico de dispersi-n' (e analizan las relaciones !ivariantes. Es un conjunto o representaci-n gr"fica de los puntos de datos !asados en dos

varia!les. (e investiga si la relaci-n entre las dos varia!les es aproximadamente lineal. Hr"fico de cajas y !igotes' (e analiza las diferencias entre grupos, es el an"lisis para detectar casos at&picos. (e transforma la distri!uci-n normal en cajas y !igotes. *a l&nea de la caja representa el valor de la mediana *a l&nea de fuera de la caja se llama !igote y representa un cuartil. Con este podemos distinguir diferencias entre grupos. Es una forma til de identificar casos at&picos porque, al transformar la distri!uci-n, los datos que queden fuera de un cuartil ser"n los casos at&picos. (e representan con asteriscos o c&rculos. !atos ausentes: 2ay que determinar si existen datos ausentes, ya que son una molestia para nosotros. 8enemos dos opciones' / Eliminar casos para evitar el sesgo. 1or lo que eliminamos y no utilizamos esos datos. 2ay que averiguar si los datos son decisorios o no. A veces, el eliminar datos no es !ueno porque tendr&amos menos datos, y no conseguimos un nivel de significaci-n acepta!le. 5o eliminar casos y sustituir datos ausentes. 8res mtodos' a$ (ustituci-n por la media' la media es el valor m"s representativo de una po!laci-n, por ello sustituimos los datos por la media. !$ (ustituci-n por valor constante' hay que !uscar alg n valor que creamos que representa esta po!laci-n, igual es necesario !uscar estudio semejante. c$ 6mputaci-n por regresi-n' para predecir el valor m"s representativo

Casos at5&icos: 2ay que decidir si emplearlos o eliminarlos. 2ay que eliminarlos si no son aleatorios. 1odemos emplear' / 1rocedimientos univariantes' el concepto de la distri!uci-n normal para ello tenemos que tipificar o estandarizar los datos. (i podemos aplicar el proceso de estandarizaci-n de datos' media igual a cero, desviaci-n est"ndar igual a 0

(i el tama.o de la muestra nI F;, podemos eliminar los datos fuera de 3.: (i el tama.o nJF;' J ? / 1rocedimientos !ivariantes' diagramas cajas y !igotes.

1rocedimientos multivariantes' %3 Mahalanovis. Es una forma de medir la distancia con la media estandarizada. (i tenemos un conjunto de datos, en primer lugar hay que determinar el punto o centroide de todas las varia!les #x$ y luego medir la distancia para cada varia!le con una media estandarizada. 1or ello, cuando existe un caso at&pico podemos medir su distancia y podemos decir en comparaci-n con otras distancias si es o no at&pico.

Su&uestos del AM. 1ara evitar los sesgos m"s importantes7 por qu de!emos sa!er si los datos cumplen los supuestos. 2ay dos razones principales' 0. *as relaciones entre una gran cantidad de varia!les son muy complejas, ha!lamos de muchos datos, y para estudiar estas relaciones utilizamos las tcnicas multivariantes. K cuando no cumplen los supuestos, los sesgos ser"n m"s potentes, al igual que las distorsiones. 3. *os procedimientos multivariantes estiman el modelo multivariante y producen resultados estad&sticos a n cuando no cumplen los supuestos. 1odemos estar analizando cosas que no tienen que ver con la realidad. *as tcnicas multivariantes tienen que cumplir los supuestos do!lemente' tienen que cumplir los supuestos como varia!les aisladas, y tienen que cumplir los supuestos de las varia!les multivariantes. Entonces, para poder aplicar las tcnicas multivariantes, se suponen las siguientes condiciones o supuestos' Nor*alidad: cumplirlo es importante porque muchas tcnicas multivariantes tiene que utilizar las estad&sticas de la prueba T y la ), y para emplearlas es necesario que la distri!uci-n sea normal.

:o*ocedasticidad: consiste en suponer que las varia!les dependientes tengan los mismos niveles de dispersi-n desde el punto de vista de la varia!le independiente. Es importante para muchas tcnicas multivariantes que utilizan las mtricas de varianza ya que es necesario que existan iguales niveles de dispersi-n # como ejemplo an"lisis discriminante $

Linealidad' Es importante porque muchas tcnicas multivariantes tienen que utilizar el concepto de correlaci-n. Es necesario que exista una relaci-n lineal entre las dos varia!les. En las tcnicas multivariantes hay que calcular las correlaciones, para lo cual se de!e cumplir el supuesto de linealidad.

Ausencia de errores correlacionados: consiste en suponer que cualquiera de los errores de predicci-n es independiente del resto. (on errores que no est"n correlaciones, que son independientes.

Clasi"icacin de los *.todos del AM.


T;CNICAS !E !E0EN!ENCIA

A D

N e

T p

A e

S n

V d

A R I A B i e n t e s

I L

I '

A R

R e

I A S D E % E l a c i n s i m

D p

I E l e

SU R

N e

A l a

D c

E % E N D i n s i m

I E N p l e

I E

TE

ES

SC

I E

I C

I C

I C

I N

E E P S E C N A D L IAE

NI N T D E

E SE P S E C N A D L I A E

NI N T D E

ES

I E

I NC

OA

T MR

EI C T A R

I NC

OA

T MR

EI C T A R

I NC

OA

I C

r r # $

a n M

A n

iN $ Oa

VR

AE

&

E CS

OI O N N " U

ND T I S O C

I ML

O #

&

I T

T;CNICAS !E IN!E0EN!ENCIA

I O

I A

" E

I S

I S

R A I AN L A

I S

I S

L U

S T C E Rm

s e

i d

e n

l o s

a t r i b

t o

I C NA O

I C

F C

1ara realizar una investigaci-n comercial multivariante hay que realizar los siguientes preguntas' L podemos dividir las varia!les en dependientes o independientesM L cu"ntas de estas varia!les son tratadas como dependientesM L c-mo son las varia!les medidas # el tipo de escala $ M

0ro1ra*as In"or*(ticos. Namos a utilizar dos programas ' (1(( y %yane E3ercicio 1 1. Define el anlisis multivariante con sus propias palabras. 2. Por qu es importante el conocimiento de las escalas de medida para planificar una investigacin de datos multivariante? 3. elaciona! distingue! " e#plica los siguientes trminos$ nivel de significacin! potencia! error de %ipo & " error de %ipo &&. '. (ules son los mtodos bsicos para e#aminar las caracter)sticas de los datos en el anlisis multivariante? Por qu son necesarios e importantes? *. Discute la siguiente afirmacin$ para utili+ar la ma"or)a de las tcnicas multivariantes no es necesario que se cumplan todos los supuestos de normalidad! linealidad! ,omocedasticidad " ausencia de errores correlacionados. 1. Define el anlisis multivariante con sus propias palabras. on a;uellas t#cnicas estad.sticas ;ue nos van a ayudar a analiBar al mismo tiempo un con(unto de variables. 'l efecto de cada una de estas variables independiente de las otras no tiene sentido: pero analiBadas simultneamente su efecto tiene interpretacin. 2. Por u! es importante el conocimiento de las escalas de medida para planificar una investigacin de datos multivariante" 'Cisten dos tipos de escalas9 m#tricas y no m#tricas. i los datos son no m#tricos: no dan valores matemticos: sin embar&o: si son m#tricos si ;ue dan valores matemticos. %or tanto: es crucial conocer ;ue escala para determinar ;ue t#cnica multivariante es ms apropiada en funcin de la escala.

3. #elaciona$ distingue$ % e&plica los siguientes t!rminos: nivel de significacin$ potencia$ error de 'ipo I % error de 'ipo II. 3ivel de si&nificacin9 me indica en ;ue medida el valor observado es representativo de la muestra. 'rror tipo I9 se define como la probabilidad de ;ue se rec<ace la <iptesis de un posible valor cundo este es cierto. 'rror tipo II9 se define como la probabilidad de ;ue se acepte la <iptesis de un posible valor cundo este es falso.

'. Cules son los m!todos bsicos para e&aminar las caracter(sticas de los datos en el anlisis multivariante" Por u! son necesarios e importantes" 'Cisten tres m#todos9 %rimero <ay ;ue saber la forma de la distribucin: para ello <acemos un <isto&rama ;ue nos va a indicar la frecuencia de los datos: esto nos indicar si eCiste una distribucin normal. 'l se&undo m#todo es el &rfico de dispersin: este nos va a servir para indicar si la relacin entre dos variables es lineal. 'l tercer m#todo son los &rficos de ca(as y bi&otes. 'ste &rfico est dividido en cuartiles y nos sirve para detectar casos at.picos. *. Discute la siguiente afirmacin: para utili)ar la ma%or(a de las t!cnicas multivariantes no es necesario ue se cumplan todos los supuestos de normalidad$ linealidad$ *omocedasticidad % ausencia de errores correlacionados. 7as t#cnicas multivariantes nos sirven para estudiar la relacin simultnea entre el comportamiento de ms de dos variables. 7a afirmacin es falsa ya ;ue esta relacin debe cumplir todos los supuestos9 el supuesto de normalidad nos servir para poder usarse los estad.sticos de la tA tudent y de la fA nedecor. 7inealidad9 nos indica la relacin eCistente entre las variables y nos permitir <allar correlaciones. =omocedasticidad9 las variables dependientes deben eC<ibir i&ual nivel de dispersin de la varianBa en todas las variables independientes. 'l >ltimo supuesto ;ue debe cumplir es ;ue cual;uier error de prediccin sea independiente del resto.

TEMA

: EL ANALISIS <ACTORIAL

Estructura de la clase: 1. !e"inicin % o'3eti+o del A<. . Conce&tos '(sicos del A<. #. !istincin entre el A<C % AC0. ). Su&uestos del AC0. ,. !ise$o del AC0. Esti*acin del n=*ero de "actores a ser e9tra5dos. M.todos de rotacin de los "actores. Criterios &ara deter*inar el ni+el de si1ni"icacin de las car1as "actoriales. -. Caso &r(ctico. /. Trata*iento de los datos con !>ANE % S0SS. !e"inicin % o'3eti+o del A<. El an"lisis factorial #A>$ se puede definir como +la tcnica estad&stica multivariante #de interdependencia$ cuyo o!jetivo principal es resumir las varia!les y extraer informaci-n #los factores m"s importantes$ de grandes !ases de datos, procurando una mejor comprensi-n de la estructura de los mismos,. El A> es una tcnica de interdependencia en la que se consideran todas las varia!les simult"neamente, y que permite extraer un n mero reducido de los factores #es decir, los valores te-ricos$ con los cuales se intenta explicar al m"ximo todo el conjunto de varia!les originales. %ichas varia!les de!en ser mtricas. El A> tiene dos o!jetivos' *a reducci-n y sintetizaci-n de los datos para identificar sus estructuras !"sicas #de las grandes OO%%$. *a creaci-n de una nueva serie de varia!les #los llamados +factores,$ que pueden ser utilizados posteriormente en otros an"lisis multivariantes #por ejemplo la regresi-n m ltiple o el an"lisis cluster$. El A> se utiliza principalmente para los siguientes tipos de investigaci-n' 6magen de marca, imagen del esta!lecimiento, imagen de los consumidores so!re una !e!ida, etc. En definitiva, se enmarca dentro de la segmentaci-n, factores principales y diferenciaci-n de nuestro producto, estudio de aptitudes, etc %ara el A) buscaremos los .ndices de correlacin entre variables: e identificaremos las correlaciones altas. 7o ;ue <aremos es (untar a;uellas ;ue ten&an una correlacin alta entre ellas y formar un factor con ellas.

Conce&tos '(sicos. Conceptos >actor %efinici-n Es el valor te-rico que se extrae con el A>. Es una com!inaci-n lineal #KPE0C0A E3C3A...A EnCn$de las varia!les originales. *os factores representan las dimensiones su!yacentes #extracci-n del >actor0$ que resumen la serie original de varia!les. 'l factor es una relacin lineal. "alcularemos D!: D0: ...: Dn para <allar el factor -2ED!F!G D0F0G...G DnFn/. 7os factores no son directamente observables. %or ello usamos la t#cnica del A). Es la correlaci-n entre las varia!les originales #el peso de cada varia!le en el factor$ y los factores, y la clave para entender la naturaleza de un factor espec&fico. *as cargas de los factores al cuadrado indican qu porcentaje de la varianza en una varia!le original se atri!uye a un determinado factor. Dic<o de un modo me(or: 7as car&as son el peso de cada variable en el )actor. 7as -"ar&as/0 es la proporcin de varianBa de la variable ;ue contribuye a las correlaciones con otras variables. 7as -"ar&as/0 E "omunalidad Es una varianza compartida con otras varia!les. Es la proporci-n de varianza de la varia!le que contri!uye a su vez con correlaciones con otras varia!les. Es una medida de la cantidad de varianza contenida en la matriz de correlaci-n de tal forma que la suma de los autovalores de!e ser igual al n mero de varia!les. 7tra definici-n/ Es la cantidad de informaci-n explicada por el modelo A> y su varianza asociada con cada factor.

Cargas

Comunalidad Autovalor #eigenvalue$

Re1las de e9traccin

1.? <actores con car1as @ ,AB .? <actores ti&o auto+alor @ 1

!istincin entre A< % AC0. En investigaci-n comercial se suelen utilizar mtodos o modelos !"sicos para o!tener soluciones factoriales' an"lisis factorial com n #A>C$ y an"lisis de componentes principales #AC1$. *a diferencia entre estos dos mtodos consiste en el tipo de varianza que analizan. En el A>C los factores se !asan solamente en la varianza com n. En el AC1 los factores se !asan en la varianza total #que incluye la varianza com n y la varianza espec&fica y error$.

-ota$ .n &nvestigacin de /ercados 0&/1! cuando se menciona 23! se est refiriendo en realidad al 2(P.

A>C AC1

Narianza com n

Narianza espec&fica y error %istorsionan los procesos de extracci-n Narianza total

4a 5arian+a %otal se divide en$ 0./ Narianza Com n' es aquella varianza donde una varia!le se comparte con todas las dem"s varia!les. 3./ Narianza Espec&fica' es aquella varianza asociada nicamente con una varia!le espec&fica. 4./ Narianza del Error' es aquella varianza de!ida al error de medici-n. En este curso, nos centramos s-lo en el AC1. 'n A)" no se usa la 6arianBa 'spec.fica y la 6arianBa de 'rror por;ue se supone ;ue distorsiona. %ero se supone ;ue tiene varios inconvenientes9 / %uede proporcionar m>ltiples soluciones en lu&ar de una: como sucede en el A"%. / 's muy dif.cil estimar slo la varianBa com>n. %or ello: los investi&adores prefieren usar el A"%: ya ;ue presenta menos inconvenientes. 'ste ser el ;ue nosotros usemos.

Su&uestos del AC0. #(on espec&ficos del AC1$ (upuestos generales' 5ormalidad, *inealidad y 2omocedasticidad. (upuesto espec&fico' (e asume que existe un nivel suficientemente elevado de correlaci-n entre las varia!les #En caso contrario, no podemos extraer factores$. Este nivel de correlaci-n se puede examinar de tres maneras' Q Examen visual de la matriz de correlaciones' eleccionamos las correlaciones altas. %ara considerar una correlacin alta: esta tiene ;ue ser H 1:$1. Q Contraste de esfericidad de Oartlett' 'sta prueba es ms ob(etiva y eficaB. 's una prueba estad.stica para eCaminar la eCistencia de correlaciones si&nificativas. 'l resultado a esta prueba ser.a I i&nificativoJ o I3o si&nificativoJ. 7a prueba de 8artlett slo prueba la presencia de relaciones si&nificativas: pero no indica el nivel de correlacin. 'sto se consi&ue con el tercer anlisis9 Kndice LM5 Q Rndice S/M/7 #la adecuaci-n muestral de Saiser/Meyer/ 7l@in$' 's una prueba ms completa a>n ;ue la anterior. e trata de cuantificar: mediante un .ndice estad.stico: el &rado de intercorrelacin entre variables: y la conveniencia del Anlisis de "omponentes %rincipales -A"%/. 'Camina la presencia de correlaciones si&nificativas indicando solamente si eCisten: no cuales son. 7os .ndices obtenidos pueden ser9 i i i i i LM5 LM5 LM5 LM5 LM5 es mayor ;ue 1:,19 obresaliente est entre 1:+1 y 1:,19 4e&ular est entre 1:*1 y 1:+19 Mediocre est entre 1:51 y 1:*19 Despreciable: y es menor ;ue 1:519 Inaceptable

%ero siempre <a de ser mayor de 1:51 para ;ue sea conveniente <acer el A"%.

!ise$o del AC0. #1rocedimientos$ Seleccin de +aria'les eleccionamos variables m#tricas. 'n caso contrario: necesitamos realiBar una transformacin de no m#tricas a m#tricas. Ta*a$o *uestral 'l criterio a se&uir para determinar el tamao muestral ptimo a utiliBar con A"%: la muestra no debe ser inferior a 51 observaciones. 7o aconse(able es ;ue sea HE !11. E9a*en de los su&uestos 1enerales 6% es&ec5"icos2 "oncepto9 "onsistencia Interna. 'st relacionado con la fiabilidad y se utiliBa para ase&urar la fiabilidad de la escala ;ue estamos utiliBando. Ase&ura ;ue los items de las escalas o las pre&untas de la escala estn midiendo las mismas contrucciones y #stas estn altamente intercorrelacionadas entre s.. %or e(9 'n el comportamiento de compra <acia una marca determinada: eCaminamos la actitud <acia el producto: precio: establecimiento: etc. %ara ello creamos una serie de pre&untas para cada dimensin. 'stas pre&untas deben estar altamente correlacionadas entre s.. 7a consistencia interna se mide mediante el test de "ronbac< -alp<a de "ronbac</ y tiene ;ue ser superior a 1:*1. 'ste test aparece en D2A3'. Matri8 de correlaciones "omo ya se <a comentado: se considera ;ue eCisten correlaciones altas cuando #stas son H 1:$1. Test de Cartlett Aplicamos el test de 8artlett y el .ndice LM5. Esti*acin del n=*ero de "actores a ser e9tra5dos 6er p&ina si&uiente. Rotacin de "actores 6er &rfico. Inter&retacin de los "actores %roceso de eti;uetacin de factores. Atribuir un si&nificado a cada factor: es decir9 poner un patrn de car&as a cada factor. Validacin Mn m#todo para efectuar una validacin a nuestro A"% es dividir la muestra en dos partes independientes y aplicar a cada una de ellas el A"%. i obtenemos los mismos factoresNdimensiones: es decir9 si coinciden ambas la muestra ser.a representativa y por tanto: el A"% ser.a vlido. Usos adicionales de los "actores

4e&resin m>ltiple o "luster.

Esti*acin del n=*ero de "actores a ser e9tra5dos

Con el fin de decidir cu"ntos factores se de!en extraer, el investigador empieza generalmente con alguno de los siguientes criterios predeterminados. Criterio de ra&z latente !>ANE AT87NA*79 Criterio a priori Criterio de porcentaje de la varianza (-lo se consideran los factores que tienen autovalores mayores que 0, ya que cualquier factor individual de!er&a explicar por lo menos una varia!le. Ka se sa!e de antemano cu"ntos factores hay que extraer so!re la !ase de un estudio previo. 9esultado del 1re/8est. (e o!tienen los factores que representan un porcentaje acumulado especificado de la varianza total extra&da #aproximadamente un B;U de la varianza total en las ciencias sociales$. (e suelen utilizar cargas y estas de!en ser J:;U del factor. (e identifica el n mero -ptimo de factores que contienen una proporci-n de la varianza com n sustancialmente alta.

Criterio de contraste de ca&da

CRITERIO !E CONTRATE !E CAI!A 6Gr("ico reali8ado con S0SS2

r!ico de sedimentacin
)

"urva con inclinacin descendente. Indica ;ue la varianBa com>n domina la %to. de corte. 7a curva se convierte en una l.nea <oriBontal. 'ste ser.a el criterio de contraste de ca.da

, $ ( ' & % $$ $( $' $& $% #$

5tra t#cnica ser.a utiliBar el criterio de 4a.B 7atente o Autovalor y comprobar con valor ! del Autovalor ;ue punto corta del &rfico. er.a otra forma obtener factores. "on esta t#cnica se obtienen ms factores ;ue con la de

Autovalor

N"mero de componente

M.todos de rotacin de los "actores. Consiste en rotar o girar los ejes de referencia de los factores para lograr un patr-n de factores m"s simple y m"s significativo.

i este fuera el pto. de corte ele&ido: tendr.amos ;ue seleccionar * factores

9otaci-n ortogonal' Es una rotaci-n ortogonal ya que se realiza en un "ngulo de G;V #tipos$ WTA986MAC NA96MAC!>ANE #utilizada en el curso$ EWT6MAC

H9A>6 C7 %E 978AC6 75
!actor II -no rotado. !actor II -rotado.
V( V)

!actor I -no rotado.

2l rotar los e6es! podemos captar ms variables que en un principio estaban ale6adas de los e6es originales.

V* V+

!actor I -rotado.

9otaci-n o!licua' Cuando nos es una rotaci-n con un "ngulo de referencia de G;V

Criterios &ara deter*inar el ni+el de si1ni"icacin de las car1as "actoriales. 0&nterpretacin de los factores1

Al interpretar los factores, se de!e determinar qu cargas factoriales merece la pena considerar. 1ara ello hay dos criterios importantes. a$ Asegurar la significaci-n pr"ctica. Muestra JP 0;; o!servaciones, seleccionamos cargas factorialesJ;,::

Muestra I 0;; o!servaciones, seleccionamos cargas factorialesJ;,=:

!$ Nalorar la significaci-n estad&stica. Ttilizar un nivel de significaci-n de ;,: y potencia de ;,F.

Caso &ractico. El caso DTeleSaEeF G1 : Velocidad de entre1a G : Ni+el de &recios G# : 0resentacin de la co*ida G) : I*a1en del lo1oti&o G, : E"icacia del ser+icio G- : Atencin al cliente G/ : Calidad de la co*ida 'l punto *: "aso prctico: lo realiBaremos con el % y el Dyane: con lo ;ue el punto + ;uedar cubierto. 'l punto + lo trataremos primero: pero slo con el Dyane y simplemente para ver los criterios a utiliBar y la interpretacin y el anlisis de los datos. =ay ;ue tener en cuenta ;ue el pro&rama Dyane ofrece tres opciones de aplicacin del A)"9 -!/ mdulo de tablas de frecuencias: -0/ mdulo de tablas de medios: y -$/ mdulo de tablas espec.ficas -D2A3': pp.$!,A$$+/. i vuestros cuestionarios se basan en &'(%'0#*1 2'$*34(%2'1: normalmente es recomendable utiliBar el primer mdulo -es decir: las variables tanto filas como columnas son cate&ricas/. in embar&o: si los cuestionarios usan &'(%'0#*1 )"!5(%2'1 con escalas de 7iOert: podr.amos ele&ir el se&undo mdulo -es decir: las variables filas son num#ricas mientras ;ue las variables columnas son cate&ricas/. i ten#is al&una duda o pre&unta: mandad un mensa(e al foro o pasad por mi despac<o con vuestros datos.

=aremos otra prctica con la 8D de TelesaOe9 -.1 Con !%ane.

A N L I S I S D E C O M P O N E N T E S P R I N C I P A L E S ===================================================================== IDENTIFICACIN DE LAS VARIABLES ------------------------------VARIABLE VARIABLE VARIABLE VARIABLE VARIABLE VARIABLE VARIABLE 1 2 3 4 5 6 7 : : : : : : : X1 X2 X3 X4 X5 X6 X7 X1 X2 X3 X4 X5 X6 X7

Ma !"# $% &'%("&"%) %* $% &'!!%+a&",) *"-.+% -------------------------------------------X1 -------1/0000 -0/3412 0/5013 0/0504 0/6111 0/0771 -0/4226 X2 --------0/3412 1/0000 -0/4272 0/2722 0/5130 0/1262 0/4617 X3 X4 X5 X6 -------- -------- -------- -------0/5013 0/0504 0/6111 0/0771 -0/4272 0/2722 0/5130 0/1262 1/0000 -0/1161 0/0666 -0/0343 -0/1161 1/0000 0/2127 0/7222 0/0666 0/2127 1/0000 0/2402 -0/0343 0/7222 0/2402 1/0000 -0/4421 0/2000 -0/0552 0/1773 X7 --------0/4226 0/4617 -0/4421 0/2000 -0/0552 0/1773 1/0000

X1 X2 X3 X4 X5 X6 X7

T%* $% Ba! +% ---------------D% %!-")a) % $% +a -a !"# $% &'!!%+a&",) = 0/002671 3" &4a$!a$' &') 21 5!a$'* $% +"6%! a$ = 567/5407 7. = 0/00008

e&>n el test de 8artlett me sale si&nificativo

FACTOR 1 FACTOR 2 FACTOR 3 FACTOR 4 FACTOR 5 FACTOR 6 FACTOR 7 -------- -------- -------- -------- -------- -------- -------VALOR PROPIO: 2/5252 2/1204 1/1211 0/5412 0/4120 0/2044 0/0012 9 DE VARIAN:A: 36/029 30/219 16/279 7/739 5/179 2/129 0/139 9 VAR;AC<M<L;: 36/029 66/379 23/259 10/129 16/159 11/279 100/009 CAR=AS DE LOS FACTORES: X1 X2 X3 X4 X5 X6 X7 -0/5220 0/7124 -0/6120 0/5640 0/1252 0/4121 0/7326 0/7515 0/0131 0/3745 0/6020 0/7721 0/6040 -0/2612 -0/2024 -0/5021 0/1727 0/4524 -0/5141 0/5412 0/0054 -0/0312 -0/0055 -0/4761 0/1014 -0/0223 0/0242 -0/5414 -0/3340 0/3115 0/3512 0/0243 -0/0117 0/0232 -0/2220 -0/0047 -0/0255 0/0320 0/3225 -0/0075 -0/3135 0/0125 0/0541 0/0502 0/0010 0/0025 -0/0604 -0/0001 -0/0001 COM<NALIDAD ----------1/0000 1/0000 1/0000 1/0000 1/0000 1/0000 1/0000

Tambi#n tenemos + factores con valores propios. 'n esta matriB consideramos todos los factores: por lo ;ue tenemos la "omunalidad i&ual a!

COEFICIENTES DE P<NT<ACIN DE LOS FACTORES: X1 X2 X3 X4 X5 X6 X7 -0/2010 0/3137 -0/2740 0/2233 0/0736 0/1142 0/2124 0/3544 0/0431 0/1766 0/2231 0/3673 0/2242 -0/1272 -0/1714 -0/4302 0/1462 0/3230 -0/5037 0/4527 0/0046 -0/0576 -0/0101 -0/2712 0/1273 -0/0522 0/0451 -1/0151 -0/7111 0/7643 0/2401 0/0522 -0/0470 0/0561 -0/6746 -0/0231 -0/1246 0/1566 1/5772 -0/0362 -1/5340 0/0105 5/1021 5/5412 0/1133 0/2730 -6/5104 -0/0146 -0/1034

'sta matriB: de momento: no tiene importancia

Ca!5a* $% +'* (a& '!%* !% %)"$'*: --------------------------------FACTOR 1 FACTOR 2 -------- --------0/5220 0/7515 0/7124 0/0131 -0/6120 0/3745 0/5640 0/6020 0/1252 0/7721 0/4121 0/6040 0/7326 -0/2612 2/1204 30/219 66/379 FACTOR 3 --------0/2024 -0/5021 0/1727 0/4524 -0/5141 0/5412 0/0054 1/1211 16/279 23/259 COM<NALIDAD ----------0/2245 0/2147 0/6410 0/2251 0/1151 0/1005 0/6123

X1 X2 X3 X4 X5 X6 X7

VARIAN:A: 2/5252 9 DE VARIAN:A: 36/029 9 VAR;AC<M<L;: 36/029

=emos obtenido $ factores ms importantes. A<ora la "omunalidad es menor ;ue !: pero bastante alta. %ero con esta matriB es dif.cil distin&uir ;ue variable es ms importante ;ue las otras. 7o ;ue podremos saber es cuanto varianBa est eCplicada con el anlisis de componentes principales. %odemos ver ;ue es muy elevada: y se pueden eCplicar casi todos los factores.

ROTACIN VARIMAX: ----------------Ca!5a* $% +'* (a& '!%* !% %)"$'* 7$%*.4>* $% +a !' a&",)8: ---------------------------------------------------------FACTOR 1 FACTOR 2 FACTOR 3 -------- -------- --------0/7524? 0/0711 0/5512 0/7531? 0/1021 0/5601 -0/2055? 0/0063 0/0015 0/1167 0/1210? 0/1525 -0/0620 0/1763 0/1711? 0/0341 0/1452? 0/0766 0/7516? 0/1130 -0/0644 1/2261 26/109 60/029 1/6215 23/169 23/259 COM<NALIDAD ----------0/2245 0/2147 0/6410 0/2251 0/1151 0/1005 0/6123

X1 X2 X3 X4 X5 X6 X7

VARIAN:A: 2/3722 9 DE VARIAN:A: 33/129 9 VAR;AC<M<L;: 33/129

7a interpretacin es muc<o ms fcil y si&nificativa. 7a varianBa eCplicada no <a cambiado. e mantiene.

COEFICIENTES DE P<NT<ACIN DE LOS FACTORES: X1 X2 X3 X4 X5 X6 X7 -0/3037 0/3452 -0/3427 -0/0121 0/0073 -0/0604 0/3014 0/0031 -0/0117 0/0614 0/5227 -0/0665 0/5522 0/0657 0/3262 0/3153 -0/0341 -0/0512 0/6242 -0/1114 -0/0407

A<ora tendremos ;ue interpretar los factores. Tendremos ;ue Iponer nombre o eti;uetaJ a cada factor. 'sto depender. =ay una re&la &eneral para atribuir si&nificado a cada factor9 iempre <ay ;ue considerar las variables con mayores car&as.

Al final tenemos la interpretacin &rfica.

REPRESENTACIN =RFICA DE LOS FACTORES -------------------------------------VARIABLES: C,$"5' -----A B C D E F = S"5)"("&a$' ---------------X1 X2 X3 X4 X5 X6 X7

FACTORES 1 @ 2: FACTOR 2 ABBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBC 1/0 D D A A AF A 0/1 D D D A A A A 0/2 D D A A A A 0/7 D D A A A A 0/6 D D A A A A 0/5 D D A A A A 0/4 D D A A A A 0/3 D D A A A A 0/2 D E D = A A A A 0/1 D D B A A A A A 0/0 D----D---C---D---D---D---D---D---D---D---D---D---D---D---D---D---D---D---D---D----AFACTOR 1 A A A -0/1 D D A A A A -0/2 D D A A A A -0/3 D D A A A A -0/4 D D A A A A -0/5 D D A A A A -0/6 D D A A A A -0/7 D D A A A A -0/2 D D A A A A -0/1 D D A A A A -1/0 D D A ABBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBBC -1/0 -0/2 -0/6 -0/4 -0/2 0/0 0/2 0/4 0/6 0/2 1/0

-.

Con S0SS. % de . Msaremos los mismos datos ;ue men> IAnaliBarN4educcin de

A<ora veremos las opciones en el antes: para el anlisis con el % . eleccionamos el elemento datosNAnlisis )actorialJ

2 nos aparecer una ventana como la si&uiente9

A<ora pulsamos IDescriptivosJ

M'$(%, +* 26((*#'2%6)*1 depender de lo ;ue ;ueramos: pero c<e;uearemos 7MO 8 9("*0' +* *1:*(%2%+'+ +* ;'($#*$$ para ase&urarnos un &rado de si&nificacin de variables

%ulsamos a<ora I'CtraccinJ9

A"$6&'#6(*1 !'86(*1 <"*: podemos cambiarlo a 1:, por e(emplo. Tambi#n podemos cambiar el criterio a N=!*(6 +* :'2$6(*1: por;ue sepamos el n>mero de factores ;ue ;ueremos eCtraer. 3osotros usaremos el primer criterio 3os interesa seleccionar tambi#n el G(>:%26 +* 1*+%!*)$'2%4): y la S6#"2%4) :'2$6(%'# 1%) (6$'(.

eleccionamos a<ora 4otacin9

eleccionamos a<ora %untuaciones9 Puardar las puntuaciones factoriales para anlisis posteriores.

'n botn opciones9

%ara A"% podemos seleccionar varios m#todos para sustituir o tratar los valores ausentes. 3osotros usaremos R**!9#','( 96( #' !*+%' ya ;ue es el valor tericamente mas representativo. 'n formato de utiliBacin: usaremos ordenados por tamao: para ayudar en la visualiBacin S"9(%!%( &'#6(*1 '016#"$61 !*)6(*1 <"*: 5pcin muy importante a seleccionar. %ulsaremos "ontinuar y Aceptar: para pasar al anlisis de los resultados

-. .1 An(lisis de los datos con S0SS.

A# ,a$torial
Notas Resultados creados Comentarios Entrada Datos ,'/MAR/#,,+ $&0+)0,# C01Documents and Settings1ecola21Escritorio1Ra!a1TeleSa 3e4sav 6ninguna7 6ninguna7 6ninguna7 $,, MISSIN :E;CL<DE0 Los valores de!inidos como perdidos por el usuario son considerados como perdidos4 MEAN S<>STIT<TI?N0 Para cada varia2le utili=ada@ los valores perdidos son sustituidos por la media de las varia2les4

5iltro Peso Segmentar arc8ivo N"m4 de !ilas del arc8ivo de tra2a9o Manipulacin de los valores perdidos De!inicin de los perdidos

Casos utili=ados4

SintaAis 5ACT?R BCARIA>LES A$ A# A( A+ A' A* A& BMISSIN MEANS<> BANALDSIS A$ A# A( A+ A' A* A& BPRINT INITIAL EM? E;TRACTI?N R?TATI?N B5?RMAT S?RT >LANE-4',. BPL?T EI EN BCRITERIA MINEI EN-$. ITERATE-#'. BE;TRACTI?N PC BCRITERIA ITERATE-#'. BR?TATI?N CARIMA; BMETF?D:C?RRELATI?N 4

Recursos

Tiempo transcurrido Memoria mAima necesaria

,0,,0,,@$* &#,+ -&@,('E. 2Gtes

-MO . /r eba de Bartlett Medida de adecuacin muestral de Eiser/MeGer/ ?l3in4 Prue2a de es!ericidad de >artlett C8i/cuadrado aproAimado gl Sig4

@++* '*&@'+$ #$ @,,,

6emos ;ue es inaceptable9 se&>n LM5 sale 1:44*. e&>n nuestro criterio: si LM5 Q 1:5 es inaceptable. in embar&o la se&unda prueba: Test de 8artlett: sale si&nificativo. %ara un estudio eCploratorio: podemos aceptar este test: puesto ;ue <a salido si&nificativo para el test de 8artlett.

Com nalidades Inicial $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, EAtraccin @))+ @)%' @*+% @))' @%%' @%,$

Celocidad de entrega Nivel de precios Presentacin de la comida Imagen del logotipo E!icacia del servicio Atencin al cliente Calidad de la comida

$@,,, @*$) MHtodo de eAtraccin0 Anlisis de Componentes principales4

'ste cuadro muestra cuanta varianBa esta eCplicada con este modelo. Inicialmente est a !: por;ue tiene todos los factores. Despu#s de la eCtraccin: ba(aR pero podemos ver ;ue estamos con niveles muy altos.

Varian0a total e1/li$ada Sumas de las saturaciones al cuadrado de la eAtraccin Total #@'#* #@$#, $@$)$ I de la varian=a (*@,)# (,@#%$ $*@)&( I acumulado (*@,)# **@(&+ )(@#+*

Autovalores iniciales Componente $ # ( + ' * & Total #@'#* #@$#, $@$)$ @'+$ @+$) @#,+ @,,% I de la varian=a (*@,)# (,@#%$ $*@)&( &@&($ '@%&# #@%#, @$($ I acumulado (*@,)# **@(&+ )(@#+* %,@%&& %*@%+% %%@)*% $,,@,,,

Suma de las saturacion la rotac Total #@(&% $@)#& $@*##

I de la varian=a ((@%)+ #*@,%)

#(@$*'

Informacin de la varianBa Informacin de antes de la rotacin despu#s de la ro


MHtodo de eAtraccin0 Anlisis de Componentes principales4

7a varianBa total eCplicada: tenemos autovalores iniciales.

r!ico de sedimentacin
(@,

#@'

#@,

$@'

$@,

Autovalor

@'

,@, $ # ( + ' * &

N"mero de componente
'l &rfico de sedimentacin. %ara determinar factores: observamos la curva: y vemos el punto de corte donde cambia la inclinacin. Ms o menos a partir del punto 4 cambia la inclinacin. e&>n este criterio podemos determinar 4 factores. %ero tambi#n <emos usado otro criterio para seleccionar factores.

Matri0 de $om/onentes2a3 Componente $ Nivel de precios Calidad de la comida Presentacin de la comida E!icacia del servicio Celocidad de entrega Atencin al cliente Imagen del logotipo @'*+ /@'#) @&%# @&(% /@*%# @&&% @&'# @*,+ @*,# /@'+# @'%' # ( @',)

MHtodo de eAtraccin0 Anlisis de componentes principales4 a ( componentes eAtraJdos

Matri0 de $om/onentes rotados2a3 Componente $ Presentacin de la comida Calidad de la comida Nivel de precios Celocidad de entrega Atencin al cliente Imagen del logotipo E!icacia del servicio /@),* @&*, @&'+ /@&'# @%+' @%#$ @%), @'*$ @'*, # (

MHtodo de eAtraccin0 Anlisis de componentes principales4 MHtodo de rotacin0 Normali=acin CarimaA con Eaiser4 a La rotacin 8a convergido en ' iteraciones4

Despu#s de la rotacin 6A4IMAF <emos obtenido $ factores: y <emos seleccionado la opcin ;ue ordena de mayor a menorR de este modo es mas fcil identificar la importancia de las variables. =emos suprimido las variables con menor importancia: as. solo salen las variables importantes.

Matri0 de trans,orma$in de las $om/onentes Componente $ # ( $ @)*' /@+'# @#$) # @+&& @*,# /@*+$ ( @$'% @*') @&(*

MHtodo de eAtraccin0 Anlisis de componentes principales4 MHtodo de rotacin0 Normali=acin CarimaA con Eaiser4

Trata*iento de los datos con !>ANE % S0SS.

/.1 Trata*iento de los datos con !>ANE.

6amos a ir viendo seleccionaremos.

las

opciones

;ue

tiene

el

Dyane

cules

M*+%'1 8 +*1&%'2%6)*1 *1$>)+'( +* #'1 &'(%'0#*1 no nos interesan T*1$ +* ;'($#*$$ si ;ue nos interesa: para ver si eCiste un nivel si&nificativo de correlacin de los factores. V'#6(*1 9(69%61 !'86(*1 <"* 1 -tambi#n llamados autovalores/.A 's el criterio para seleccionar las car&as. R*9(*1*)$'2%4) G(>:%2' +* #61 :'2$6(*19 representar 0 factores R6$'2%4) VARIMA?.A Pirar los e(es de referencias para captar mas variables o <acer la Interpretacin ms fcil. 's el m#todo mas frecuentemente utiliBado. A<ora seleccionamos9 G"'(+'( #61 :'2$6(*1 (*$*)%+61 26!6 &'(%'0#*1.A su uso posterior 2 seleccionamos las variables a estudiar.

e &uardarn para

A N L I S I S D E C O M P O N E N T E S P R I N C I P A L E S ===================================================================== IDENTIFICACIN DE LAS VARIABLES ------------------------------VARIABLE 1 : EP<EOBEC VARIABLE 2 : EP<EOBSO VARIABLE 3 : DIREES<F %-.!%*a; VARIABLE 4 : ECMEEPLA .+a)"("&a$a .'! %+ %* VARIABLE 5 : DESPELIB VARIABLE 6 : LIBERAL VARIABLE 7 : ECSOLMER VARIABLE 2 : SOCIALIS VARIABLE 1 : COM<NISM VARIABLE 10: EMPRECRE VARIABLE 11: EMPREEXP VARIABLE 12: BENEOB31 VARIABLE 13: BENSOLAC VARIABLE 14: BALESOCI VARIABLE 15: MARLENEC - La %-.!%*a .F6+"&a .4%$% &4-.+"! +'* '6G% "H'* %&'),-"&'* -%G'! I4% +a .!"Ha$a; - La %-.!%*a .F6+"&a .4%$% &4-.+"! +'* '6G% "H'* *'&"a+%* -%G'! I4% +a .!"Ha$a - La $"!%&&",) $% +a %-.!%*a $%6% *%! %+%5"$a .'! *4(!a5"' 4)"H%!*a+/ .'! '$'* +'*

!a6aGa$'!%* $% +a

- La %&')'-Ja $% -%!&a$' .!'.'!&"')a 4)a a*"5)a&",) $% !%&4!*'* -%G'! I4% +a '6 %)"$a &') +a %&')'-Ja a$'; - La .'*"6"+"$a$ $% $%*."$' +"6!%/ &') ")$%-)"#a&",)/ .%!-" "!Ja +a &!%a&",) $% .4%* '* $% !a6aG'; - E+ +"6%!a+"*-' %* +a -%G'! $'& !")a %&'),-"&a; - La %&')'-Ja *'&"a+ $% -%!&a$' %* +a -%G'! $'& !")a %&'),-"&a; - E+ *'&"a+"*-' %* +a -%G'! $'& !")a %&'),-"&a; - E+ &'-4)"*-' %* +a -%G'! $'& !")a %&'),-"&a; - E+ %-.!%*a!"' $%6% *%! a$-"!a$' .'! +a *'&"%$a$ .'!I4% &!%a !"I4%#a; - E+ %-.!%*a!"' *,+' %K.+' a a +'* !a6aGa$'!%*; - E+ 6%)%("&"' $%6%! *%! %+ .!"-%! '6G% "H' $% +a %-.!%*a - E) +a $"* !"64&",) $% +'* 6%)%("&"'* $%6%) .a! "&".a! *,+' +'* a&&"')"* a*; - T'$a* +a* %-.!%*a* $%6%!Ja) !%a+"#a! %+ 6a+a)&% *'&"a+; - E+ -a!M% ")5 %* *,+' 4) -> '$' .a!a H%)$%! -N*/ &!%a)$' )%&%*"$a$%* a.a!%) %*;

Ma !"# $% &'%("&"%) %* $% &'!!%+a&",) *"-.+% -------------------------------------------EP<EOBEC EP<EOBSO BENSOLAC BALESOCI MARLENEC -------- --------------- -------- -------EP<EOBEC 1/0000 0/3724 -0/1036 0/2605 0/1421 EP<EOBSO 0/3724 1/0000 0/0630 0/2315 0/1735 DIREES<F 0/1111 0/1124 -0/2475 0/0156 0/0262 ECMEEPLA -0/2255 -0/1153 0/2121 -0/1732 -0/0510 DESPELIB -0/0102 0/0014 0/2362 -0/1042 -0/0474 LIBERAL -0/1247 -0/1021 0/1302 -0/0212 -0/1051 ECSOLMER -0/0752 0/0015 0/0722 0/0730 -0/0031 SOCIALIS 0/2727 0/3173 -0/1522 0/2371 0/1737 COM<NISM 0/2316 0/1115 -0/0565 0/1244 0/0425 EMPRECRE -0/1537 -0/0273 0/2321 0/0103 -0/2072 EMPREEXP 0/1265 0/2423 -0/1110 0/0427 0/2745 BENEOB31 -0/1001 0/0432 0/2255 -0/0242 0/0044 BENSOLAC -0/1036 0/0630 1/0000 -0/2124 0/1432 BALESOCI 0/2605 0/2315 -0/2124 1/0000 0/0562 MARLENEC 0/1421 0/1735 0/1432 0/0562 1/0000 DIREES<F ECMEEPLA DESPELIB LIBERAL ECSOLMER SOCIALIS COM<NISM EMPRECRE EMPREEXP BENEOB31

-------- -------- -------- -------- -------- -------- -------- -------- -------- -------0/1111 0/1124 1/0000 -0/1122 -0/2233 -0/1370 -0/2437 0/2056 0/2433 -0/3522 0/0161 -0/2135 -0/2475 0/0156 0/0262 -0/2255 -0/1153 -0/1122 1/0000 0/2622 0/3202 0/1476 -0/3411 -0/2504 0/3204 -0/2116 0/1111 0/2121 -0/1732 -0/0510 -0/0102 0/0014 -0/2233 0/2622 1/0000 0/1614 -0/0017 -0/0722 0/0042 0/2775 -0/1216 0/1412 0/2362 -0/1042 -0/0474 -0/1247 -0/1021 -0/1370 0/3202 0/1614 1/0000 -0/0326 -0/2115 -0/0233 0/3533 -0/1451 0/1311 0/1302 -0/0212 -0/1051 -0/0752 0/0015 -0/2437 0/1476 -0/0017 -0/0326 1/0000 0/0671 -0/0432 0/0226 0/0202 0/1621 0/0722 0/0730 -0/0031 0/2727 0/3173 0/2056 -0/3411 -0/0722 -0/2115 0/0671 1/0000 0/3722 -0/1305 0/3372 0/0722 -0/1522 0/2371 0/1737 0/2316 0/1115 0/2433 -0/2504 0/0042 -0/0233 -0/0432 0/3722 1/0000 -0/1362 0/1437 -0/0371 -0/0565 0/1244 0/0425 -0/1537 -0/0273 -0/3522 0/3204 0/2775 0/3533 0/0226 -0/1305 -0/1362 1/0000 -0/2662 0/2522 0/2321 0/0103 -0/2072 0/1265 0/2423 0/0161 -0/2116 -0/1216 -0/1451 0/0202 0/3372 0/1437 -0/2662 1/0000 -0/0260 -0/1110 0/0427 0/2745 -0/1001 0/0432 -0/2135 0/1111 0/1412 0/1311 0/1621 0/0722 -0/0371 0/2522 -0/0260 1/0000 0/2255 -0/0242 0/0044

T%* $% Ba! +% ---------------D% %!-")a) % $% +a -a !"# $% &'!!%+a&",) = 0/023411 3" &4a$!a$' &') 105 5!a$'* $% +"6%! a$ = 325/4217

7. = 0/00008

FACTOR 1 FACTOR 2 FACTOR 3 FACTOR 4 FACTOR 5 FACTOR 6 FACTOR 7 FACTOR 2 FACTOR 1 FACTOR 10FACTOR 11FACTOR 12FACTOR 13FACTOR 14FACTOR 15 -------- -------- -------- -------- -------- -------- -------- -------- -------- -------- -------- --------------- -------- -------VALOR PROPIO: 3/2405 1/7250 1/3244 1/2012 1/0116 0/2267 0/2311 0/7205 0/7422 0/6177 0/6441 0/5256 0/4221 0/4305 0/3230 9 DE VARIAN:A: 21/609 11/509 2/239 2/079 6/209 5/119 5/609 5/209 4/119 4/659 4/309 3/109 3/229 2/279 2/559 9 VAR;AC<M<L;: 21/609 33/109 41/139 50/009 56/209 62/719 62/319 73/519 72/509 23/159 27/459 11/369 14/529 17/459 100/009 CAR=AS DE LOS FACTORES: COM<NALIDAD ----------EP<EOBEC 0/5235 -0/2531 -0/3072 0/0523 -0/1261 -0/0672 1/0000 EP<EOBSO 0/4511 -0/5037 -0/1217 -0/0261 0/2257 0/0246 1/0000 DIREES<F 0/5552 0/3156 -0/2000 0/1121 -0/1614 -0/2222 1/0000 ECMEEPLA -0/6326 -0/0655 -0/0066 -0/3762 -0/0352 0/1230 1/0000 DESPELIB -0/3226 -0/3667 -0/1716 0/1676 -0/0666 -0/0620 1/0000 LIBERAL -0/4251 -0/0171 -0/3671 0/2321 -0/0242 0/1245 1/0000 ECSOLMER -0/1213 -0/3571 0/3072 0/2517 0/0423 -0/0621 1/0000

-0/1527 -0/2161 -0/3165 -0/1343 -0/2177 -0/1712 0/6023

0/2203 0/1656 0/0213 0/3373 -0/2463 0/3171 0/2343

0/3032 0/2151 -0/1671 -0/2615 -0/2601 -0/3404 -0/1425

-0/1221 -0/0242 0/0560 -0/1216 -0/4710 0/4621 -0/2220

-0/0152 -0/0671 0/3367 0/1141 -0/3336 0/0215 0/3566

-0/1707 -0/4110 -0/1606 -0/1253 0/0556 -0/0204 -0/1725

-0/0222 0/0512 0/3340 0/3251 0/1731 -0/1731 -0/0531

0/5343 -0/2250 -0/2221 0/0272 0/0756 0/0135 0/0370

-0/1112 0/1113 -0/0357 -0/1241 0/2433 0/1465 0/0767

SOCIALIS 0/6155 -0/4176 0/0023 0/1352 -0/1155 0/3621 1/0000 COM<NISM 0/4651 -0/2567 -0/3055 -0/2054 0/1271 -0/0644 1/0000 EMPRECRE -0/5246 -0/3547 -0/3622 0/0744 0/1511 -0/2551 1/0000 EMPREEXP 0/4222 -0/2042 0/4300 -0/1632 -0/1202 -0/1224 1/0000 BENEOB31 -0/3065 -0/5474 0/1011 -0/1032 -0/0147 -0/1472 1/0000 BENSOLAC -0/3173 -0/4402 0/2320 -0/0015 -0/3004 0/0461 1/0000 BALESOCI 0/3613 -0/2111 -0/4642 -0/1521 -0/2122 -0/0306 1/0000 MARLENEC 0/2214 -0/2252 0/4621 0/1171 0/2121 -0/0411 1/0000

0/1220 -0/0732 0/1120 0/0150 0/1645 -0/4225 0/3434 -0/3141

-0/2612 -0/3725 0/0106 0/1403 -0/2222 -0/0773 0/4072 0/3551

-0/1501 -0/3233 0/0046 -0/4342 0/1220 0/2211 0/0610 -0/0255

0/0423 -0/0276 0/0217 0/1567 0/4661 -0/0717 -0/0662 0/0250

-0/0571 0/3765 -0/1426 -0/3512 0/0161 0/2204 -0/0473 0/0344

0/0572 0/1417 0/0432 -0/2127 -0/0266 0/0452 0/3152 0/4721

0/2131 -0/2632 -0/0410 -0/1132 0/3412 -0/3367 0/0111 0/1411

-0/0255 0/1242 -0/2201 -0/0337 0/1750 -0/2321 -0/1153 0/0201

-0/3036 0/0362 -0/4571 -0/0502 0/1211 -0/0467 0/2022 -0/0472

Despu#s de esta matriB: salen coeficientes de puntuacin de los factores.

e tienen ;ue multiplicar cada coeficiente de correlacin por las variables ori&inales para comprobar los resultados de los factores
COEFICIENTES DE P<NT<ACIN DE LOS FACTORES: EP<EOBEC 0/1615 -0/1472 0/1207 -0/2122 -0/1755 EP<EOBSO 0/1411 -0/2120 -0/1200 0/6636 0/2202 DIREES<F 0/1715 0/1221 0/3171 -0/3134 -0/5157 ECMEEPLA -0/1152 -0/0371 -0/7203 -0/0231 0/3212 DESPELIB -0/1111 -0/2126 0/3470 -0/1546 -0/1774 LIBERAL -0/1411 -0/0562 0/4132 -0/0575 0/4217 ECSOLMER -0/0311 -0/2075 0/5372 0/0123 -0/1711 SOCIALIS 0/1211 -0/2421 0/2212 -0/2624 0/1453 COM<NISM 0/1432 -0/1422 -0/4253 0/4363 -0/1621 EMPRECRE -0/1204 -0/2056 0/1541 0/3527 -0/6651 EMPREEXP 0/1422 -0/1124 -0/3371 -0/4125 -0/4763 BENEOB31 -0/0146 -0/3174 -0/2137 -0/2200 -0/3243 BENSOLAC -0/1226 -0/2552 -0/0116 -0/6172 0/1204 BALESOCI 0/1140 -0/1270 -0/3167 -0/4141 -0/0711 MARLENEC 0/0213 -0/1657 0/2442 0/5066 -0/1223 -0/2324 -0/0171 -0/1510 -0/0050 -0/1216 -0/2772 0/2324 0/0017 -0/2307 -0/2720 0/3247 0/0761 0/1752 -0/3501 0/3535 -0/1312 -0/1726 -0/2616 -0/1110 -0/2460 -0/1420 0/4172 0/1554 -0/0610 0/0175 0/0124 0/1351 -0/3542 0/2232 -0/3252 0/2161 0/1624 0/0227 0/3302 -0/2416 0/3110 0/2212 -0/2646 -0/3653 0/0104 0/1376 -0/2227 -0/0752 0/3114 0/3410 0/3411 0/2425 -0/1224 -0/2141 -0/2134 -0/3231 -0/1607 -0/1613 -0/4323 0/0052 -0/4217 0/2052 0/2513 0/0627 -0/0222 -0/1454 -0/0215 0/0667 -0/2252 -0/5607 0/5511 -0/3352 0/0504 -0/0321 0/0173 0/1265 0/5552 -0/0141 -0/0722 0/1012 -0/0202 -0/0270 0/4314 0/2427 -0/4275 0/0276 0/4561 -0/0731 0/4224 -0/1222 -0/4602 0/1231 0/3512 -0/0606 0/0441 -0/2220 -0/5516 -0/2144 -0/1673 0/0743 -0/1074 -0/2323 0/0764 0/2000 0/0525 -0/2240 -0/0355 0/0604 0/5272 0/6316 -0/1273 0/0733 0/4727 0/4651 0/2421 -0/2412 -0/0760 0/3054 -0/3772 -0/0522 -0/2777 0/4211 -0/4225 0/0225 0/2141 0/2224 -0/4420 -0/3457 0/1362 0/1172 0/1441 0/0574 -0/1326 0/1126 -0/3426 -0/0522 0/2714 -0/3705 -0/3021 0/1242 -0/3402 0/3267 -0/0610 -0/3152 0/4154 0/2502 0/1310 -0/5124 0/0612 -0/7211 -0/0262 0/3242 -0/0712 0/3463 -0/0206

Ca!5a* $% +'* (a& '!%* !% %)"$'*: ---------------------------------

A;u. <an salido 5 factores sin rotacin. %ero esta matriB es dif.cil de interpretar por;ue tiene las car&as muy altas para el factor ! y para el factor 0. Aun;ue <emos eCtra.do varios factores: como tienen elevados n>meros en las car&as: no sabemos ;ue factor es ms importante ;ue otro. @A"5 &'(%'0#* *1 !>1 %!96($')$* <"* #'1 6$('1B

EP<EOBEC EP<EOBSO DIREES<F ECMEEPLA DESPELIB LIBERAL ECSOLMER SOCIALIS COM<NISM EMPRECRE EMPREEXP BENEOB31 BENSOLAC BALESOCI MARLENEC

FACTOR 1 -------0/5235 0/4511 0/5552 -0/6326 -0/3226 -0/4251 -0/1213 0/6155 0/4651 -0/5246 0/4222 -0/3065 -0/3173 0/3613 0/2214

FACTOR 2 --------0/2531 -0/5037 0/3156 -0/0655 -0/3667 -0/0171 -0/3571 -0/4176 -0/2567 -0/3547 -0/2042 -0/5474 -0/4402 -0/2111 -0/2252 1/7250 11/509 33/109

FACTOR 3 --------0/3072 -0/1217 -0/2000 -0/0066 -0/1716 -0/3671 0/3072 0/0023 -0/3055 -0/3622 0/4300 0/1011 0/2320 -0/4642 0/4621 1/3244 2/239 41/139

FACTOR 4 --------0/1527 -0/2161 -0/3165 -0/1343 -0/2177 -0/1712 0/6023 0/1220 -0/0732 0/1120 0/0150 0/1645 -0/4225 0/3434 -0/3141 1/2012 2/079 50/009

FACTOR 5 -------0/2203 0/1656 0/0213 0/3373 -0/2463 0/3171 0/2343 -0/2612 -0/3725 0/0106 0/1403 -0/2222 -0/0773 0/4072 0/3551 1/0116 6/209 56/209

COM<NALIDAD ----------0/5061 0/5561 0/5416 0/5363 0/4641 0/5111 0/6571 0/6613 0/5205 0/6172 0/4711 0/5142 0/5151 0/6242 0/6666

VARIAN:A: 3/2405 9 DE VARIAN:A: 21/609 9 VAR;AC<M<L;: 21/609

=aremos la rotacin 6A4IMAF para ver ;ue factor es ms importante. 6emos la car&a de los factores retenidos despu#s de la rotacin
ROTACIN VARIMAX: ----------------Ca!5a* $% +'* (a& '!%* !% %)"$'* 7$%*.4>* $% +a !' a&",)8: ---------------------------------------------------------FACTOR 1 -------0/6423? 0/6071? 0/2243 -0/1221 0/0016 0/1713 0/0430 0/3214 0/3772 0/1371 0/1222 -0/0410 -0/1442 0/7363? 0/1222 FACTOR 2 --------0/2070 -0/0624 -0/5121? 0/1505 -0/0427 -0/0204 0/7164? 0/1302 -0/2174 0/2112 0/1342 0/4525 0/0421 0/1201 -0/0402 1/4713 1/269 21/729 FACTOR 3 -------0/1735 0/3417 0/1106 -0/0201 -0/1402 -0/2113 0/1011 0/1344 -0/1014 -0/4110 0/5702? -0/0771 0/2202 -0/1301 0/2001? 1/5016 10/069 31/249 FACTOR 4 --------0/0520 0/1711 -0/3031 0/2360 0/6551? 0/2424 -0/0121 0/0421 0/1771 0/4414? -0/1524 0/5322? 0/6732? -0/3032 0/0731 1/7740 11/239 43/679 FACTOR 5 -------0/1362 0/1245 0/1110 -0/6652? -0/1152 -0/6147? -0/0163 0/6276? 0/5351? -0/3617 0/3011 0/1362 -0/1177 -0/0112 -0/0316 1/1610 13/139 56,80% COM<NALIDAD ----------0/5061 0/5561 0/5416 0/5363 0/4641 0/5111 0/6571 0/6613 0/5205 0/6172 0/4711 0/5142 0/5151 0/6242 0/6666

EP<EOBEC EP<EOBSO DIREES<F ECMEEPLA DESPELIB LIBERAL ECSOLMER SOCIALIS COM<NISM EMPRECRE EMPREEXP BENEOB31 BENSOLAC BALESOCI MARLENEC

VARIAN:A: 1/7276 9 DE VARIAN:A: 11/129 9 VAR;AC<M<L;: 11/129

Tres efectos de la rotacin 6A4IMAF9 7a cantidad total de varianBa es la misma. "on este modelo factorial <emos eCplicado un 5*.,1S de la varianBa total. A<ora <emos me(orado la interpretacin de los datos y podemos distin&uir ;ue variable tiene mas peso en cada factor.

in embar&o: la varianBa es de cada factor es menor. =emos redistribuido la varianBa: para ;ue cada factor ten&a niveles seme(antes de varianBa. Tercer efecto de la rotacin es ;ue <emos me(orado la interpretacin de los datos: A<ora podemos ver ;ue variable tiene mas peso para cada factor -las ;ue tienen T/.

COEFICIENTES DE P<NT<ACIN DE LOS FACTORES: EP<EOBEC EP<EOBSO DIREES<F ECMEEPLA DESPELIB LIBERAL ECSOLMER SOCIALIS COM<NISM EMPRECRE EMPREEXP BENEOB31 BENSOLAC BALESOCI MARLENEC 0/3741 0/3335 0/0243 0/0621 0/0263 0/2411 0/0500 0/1054 0/1320 0/1150 -0/0122 -0/0411 -0/0732 0/4120 0/0440 -0/1147 -0/0433 -0/3752 0/0363 -0/1343 -0/0204 0/5174 0/1316 -0/1461 0/1332 0/1411 0/2523 -0/0735 0/1164 -0/0222 0/0637 0/1266 0/0237 0/1126 -0/0756 -0/0564 0/0106 -0/0401 -0/1157 -0/2445 0/3517 -0/0641 0/2511 -0/1325 0/5107 0/0151 0/1552 -0/0710 0/0240 0/4103 0/0551 -0/1776 0/1123 0/2226 0/1222 -0/0655 0/3001 0/4030 -0/2336 0/0566 -0/0101 -0/0352 -0/0170 -0/3771 0/0412 -0/3202 -0/0111 0/3777 0/3223 -0/1141 0/0672 0/2253 -0/0401 -0/1711 -0/1221

REPRESENTACIN =RFICA DE LOS FACTORES -------------------------------------VARIABLES: C,$"5' -----A B C D E F = O I 3 L L M N O S"5)"("&a$' ---------------EP<EOBEC EP<EOBSO DIREES<F ECMEEPLA DESPELIB LIBERAL ECSOLMER SOCIALIS COM<NISM EMPRECRE EMPREEXP BENEOB31 BENSOLAC BALESOCI MARLENEC

FACTORES 1 @ 2:

FACTOR 2 ABBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBC 1/0 D D A A A A 0/1 D D A A A A 0/2 D D = A A A A 0/7 D D A A A A 0/6 D D A A A A 0/5 D D A A L A A 0/4 D D A A A A 0/3 D D 3 A A A A 0/2 D D N A A D A L O A 0/1 D D A A M A A 0/0 D----D---D---D---D---D---D---D---D---D---D---D--FD---D---D---D---D---D---D---D----AFACTOR 1 A E O B A -0/1 D D A A A A -0/2 D D I A A A A A -0/3 D D A A A A -0/4 D D A A A A -0/5 D D A A A A -0/6 D D C A A A A -0/7 D D A A A A -0/2 D D A A A A -0/1 D D A A A A -1/0 D D A ABBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBDBBBBC -1/0 -0/2 -0/6 -0/4 -0/2 0/0 0/2 0/4 0/6 0/2 1/0

Tenemos una representacin &rfica para los factores ! y 0 despu#s de la rotacin 6A4IMAF.

E3ercicio 0. %efine y relaciona los siguientes trminos' factor, cargas, y comunalidad. 3. LCu"les son los criterios que podemos emplear para determinar el n mero de factores a extraerM 4. L1ara qu usar&amos una rotaci-n ortogonal en el AC1M ?. Construye un dise.o adecuado para el siguiente estudio con el AC1' +*a imagen juega un papel de gran importancia en el mar@eting. Tna imagen de marca se puede examinar desde la interacci-n de varias dimensiones o construcciones que caracterizan a dicha marca. En el presente estudio, nos centraremos en identificar la imagen de OMX que motiva a los consumidores potenciales hacia la compra..., :. 8ras realizar una investigaci-n so!re la imagen de OMX, se consiguieron los siguientes resultados. 6nterpreta lo que indica la ta!la y prepara un informe' ////////////////////////////////////////////////////////// Cargas de los factores retenidos #despus de la rotaci-n$' >AC879 0 >AC879 3 C7MT5A*6%A% 1restigio ;.B043Y ;.343F ;.:4;3 Estatus social ;.?:;GY ;.;F:= ;.:0;B Calidad ;.43F=Y ;.;:G: ;.?:0B (ofisticaci-n ;.BB;:Y /;.34B? ;.:GB4 8ecnolog&a /;.;G4; ;.:BG;Y ;.:?== Extravagancia /;.?G0B /;.=3B4Y ;.:BG3 VARIANHA: B !E VARIANHA: B VAR.ACUMUL.: 0.B=F; 3=.G=U 3=.G=U 0.:F=: 3B.?BU :?.?4U

1. !e"ine % relaciona los si1uientes t.r*inos: "actor7 car1as7 % co*unalidad.

. ICu(les son los criterios Jue &ode*os deter*inar el n=*ero de "actores a e9traerK

e*&lear

&ara

%ara el >ltimo criterio es posible ;ue se ;uiera eCplicar &rficamente con el &rafico de sedimentacin. Tendr.amos ;ue eCplicar como determinar el punto de corte.

#. I0ara Ju. usar5a*os una rotacin orto1onal en el AC0K 7a rotacin es una manipulacin matemtica del A"% ;ue facilita la interpretacin de factores. e utiliBa para lo&rar un patrn de factores ms simple y tericamente ms si&nificativo. T#cnicamente: la rotacin consiste en &irar los e(es de referencia de los factores <asta alcanBar una determinada posicin para redistribuir la varianBa de los mismos. i se mantiene un n&ulo de 91 &rados: se llama rotacin orto&onal: y sino se denomina rotacin oblicua. 'n el A"%: normalmente se usa la rotacin orto&onal. 'n el libro de AM: vienen eCplicados todos estos sistemas de rotacin ). Constru%e un dise$o adecuado &ara el si1uiente estudio con el AC0: DLa i*a1en 3ue1a un &a&el de 1ran i*&ortancia en el *arEetin1. Una i*a1en de *arca se &uede e9a*inar desde la interaccin de +arias di*ensiones o construcciones Jue caracteri8an a dic4a *arca. En el &resente estudio7 nos centrare*os en identi"icar la i*a1en de CML Jue *oti+a a los consu*idores &otenciales 4acia la co*&ra...F 'n el apartado de 60C*$%&6 del estudio se puede escribir al&o como lo de arriba. 'n la %)$(6+"22%4) <abr.a ;ue intentar convencer de por;ue el profesor tiene ;ue leer ese traba(o. 3ormalmente la introduccin es para resumir las partes ms importantes y convencer de por;ue leer el traba(o. %rimeramente: investi&aremos la literatura eCistente para establecer el estado del arte. A continuacin: establecemos las <iptesis ;ue ;ueremos validar o rec<aBar mediante el estudio.

?%or ;u# ;ueremos efectuar este estudioU 's una de las pre&untas a responder. Diferentes a ob(etivos. A<ora estableceremos y concretaremos las partes t#cnicas9 variables y escalas. 'n el A"% se pueden utiliBar solo variables m#tricas. i tenemos variables cate&ricas: las tenemos ;ue convertir en variables m#tricas. 'ste tipo de variables se llaman variables ficticias. Dependiendo de la t#cnica multivariante: podemos utiliBar estas variables ficticias para el anlisis. A<ora determinamos el tamao muestral. "omo re&la &eneral: el tamao de la muestra debe ser por lo menos 51: y preferiblemente superior a !11 observaciones. 6enta(a de realiBar revisin biblio&rfica9 saber como se disean los estudios: saber ;ue variables: ;ue escalas: ;ue t#cnicas multivariantes se <an realiBado. As. tendremos me(or informacin para saber tipo de variables y tipo de escalas. Despu#s de determinar el tamao muestral: <ay ;ue concretar los m#todos de la investi&acin: instrumentos: coleccin de datos: muestreo: etc. A<ora eCaminamos los supuestos. A<ora ya tenemos datos: y tenemos ;ue eCaminar los supuestos. =ay dos tipos de supuestos a eCaminar9 Aparte de los supuestos principales como la normalidad: la linealidad y la <omocedasticidad: <ay ;ue eCaminar el supuesto espec.fico9 ver si eCiste un alto nivel de correlacin entre las variables. %ara eCaminarlo9 'Camen visual de la matriB de correlaciones: Test de 8artlett: Indice LM5 Despu#s determinamos el n>mero de factores a ser eCtra.dos. 6er el criterio9 "riterio "riterio "riterio "riterio de ra.B latente a priori de porcenta(e de la varianBa de contraste de ca.da

i seleccionamos varios criterios -como <oy/: una re&la &eneral: emp.ricaR cuando seleccionamos "riterio de contraste de ca.da: normalmente salen uno o dos factores ms ;ue cuando se selecciona el "riterio de 6alores %ropios mayores ;ue uno. 's l&ico: ya ;ue el "riterio de "ontraste de "a.da es un simple eCamen visual: y el otro es muc<o ms emp.rico y ob(etivo.

=ar# una revisin biblio&rfica: y si salen los factores ;ue espero despu#s de mi revisin biblio&rfica: me puedo ;uedar con ese criterio Tambi#n se realiBa normalmente la rotacin orto&onal de los factores para su me(or interpretacin. Despu#s de esto: tenemos ;ue atribuir si&nificado a cada factor asi&nndole una eti;ueta adecuada. )inalmente: realiBaremos una interpretacin y validacin de los factores

,. Tras reali8ar una in+esti1acin so're la i*a1en de CML7 se consi1uieron los si1uientes resultados. Inter&reta lo Jue indica la ta'la % &re&ara un in"or*e: ////////////////////////////////////////////////////////// Cargas de los factores retenidos #despus de la rotaci-n$' >AC879 0 >AC879 3 C7MT5A*6%A% 1restigio ;.B043Y ;.343F ;.:4;3 Estatus social ;.?:;GY ;.;F:= ;.:0;B Calidad ;.43F=Y ;.;:G: ;.?:0B (ofisticaci-n ;.BB;:Y /;.34B? ;.:GB4 8ecnolog&a /;.;G4; ;.:BG;Y ;.:?== Extravagancia /;.?G0B /;.=3B4Y ;.:BG3 VARIANHA: B !E VARIANHA: B VAR.ACUMUL.: 0.B=F; 3=.G=U 3=.G=U 0.:F=: 3B.?BU :?.?4U

Dos puntos a tener en cuenta9 !. 3o se deben repetir: sino interpretar los datos "uando ya se tienen los datos: no importan las respuestas ;ue repiten datos9 Vya se pueden ver en la tablaW 0. 4ealiBar recomendaciones9 a/ para la empresa: y b/ para los investi&adores 'ntonces9 Diremos ;ue variable tiene mayor importancia en cada factor. %e 7ue&o diremos como interpretar estos datos. 'n el cuadro no dice nada sobre la interpretacin. 'ntonces: para )A"T54 ! y )A"T54 0 tendremos ;ue interpretar.

%ara poner una eti;ueta al )A"T54 !: pensaremos en al&una palabra ;ue ten&a ;ue ver con sofisticacin: presti&io: estatus social y calidad. I7os elementos determinantes de la ima&en implican una relacin co<erente entre todos los factores eCtra.dos. 'l primer factor se puede eti;uetar como I'statusJ: e indica la ima&en de presti&io ;ue da la marca 8MX. 7a ofisticacin <a sido percibida como la ima&en principal de dic<a marca. 'sta ima&en parece ser una percepcin &eneral de 8MX. 'l se&undo factor es ms dif.cil interpretar: ya ;ue eCisten dos elementos contradictorios: es decir: Tecnolo&.a y 'Ctrava&ancia. %robablemente: la marca 8MX <a sido evaluada de tal manera debido al elevado nivel de precio ;ue no necesariamente compensa el nivel de tecnolo&.a percibida.J. <intaro. Mno de los peli&ros del A"% es la sub(etividad a la <ora de interpretar los factores. "on esta t#cnica no se puede evitar la interpretacin sub(etiva. 5tro de los peli&ros es la interpretacin de las eti;uetas. Deber.amos eCplicar ;ue si&nifica cada eti;ueta. IDesde el punto de vista empresarial: nuestra recomendacin seria realiBar acciones filantrpicas con el fin de aumentar su ima&en social: tales como patrocinar partidos deportivos: llevar a cabo actividades culturales: etc. Tambi#n <abr.a ;ue <acer una publicidad comparativa entre la marca 8MX y otras marcas competidoras para convencer a los consumidores de ;ue la relacin entre precio y calidad es e;uilibrada o incluso superior a la de otras marcas. Metodol&icamente: <ay dos advertencias ;ue merecen nuestra atencin. %rimero: el <ec<o de ;ue el estudio <a eCtra.do solo dos factores implica ;ue el n>mero de .tems incluidos en el cuestionario probablemente no era suficiente. e&undo: como los factores eCplican solo la mitad -un 54S/ de la varianBa total: eCistir.an otras dimensiones o construcciones ;ue eCplican la otra mitad de la varianBa. 'n un futuro estudio: se deben considerar e incorporar estas dos limitaciones para aumentar la si&nificacin tanto prctica como estad.stica.J. <intaro.

TEMA #: EL ANALISIS <ACTORIAL !E CORRES0ON!ENCIAS

Estructura de la clase: 1. Introduccin. . !e"inicin % o'3eti+o del A<C. #. Conce&tos '(sicos del A<C. ). Su&uestos del A<C. ,. !ise$o del A<C. 7. Casos &r(cticos con !>ANE.

Introduccin. En el pasado, las tcnicas de descomposici-n del an"lisis multidimensional #AM$ han sido frecuentemente utilizadas. El AM es un conjunto de procedimientos para desplegar las relaciones #de similitud o preferencia$ mediante un mapa perceptual. (in em!argo, en las ltimas pocas, se han com!inado aspectos del an"lisis factorial o del an"lisis discriminante y del an"lisis multidimensional para configurar una nueva tcnica llamada +an"lisis factorial de correspondencias,. 'l AM es una t#cnica de descomposicin de datos y #stos se representan mediante un mapa perceptual: donde 's una t#cnica para analiBar tablas de contin&encia. 4e;uiere de una matriB de datos con entradas 35 ne&ativas. e utiliBan variables cate&ricas nominales: de a<. ;ue no puedan <aber datos ne&ativos. e tienen ;ue identificar correctamente los ob(etos y los atributos. '(emplo9 AnaliBamos las cerveBas ms representativas del mercado espaol. Yueremos saber el posicionamiento de las marcas eCistentes en la actualidad para introducir una nueva marca de cerveBa eCtran(era9
SanMiguel A Amstel 58Z'T5 CruzCampo Heineken Mahou

-marcas representativas/

Sabor Pr ecio AT4I8MT5 Envase

5tro e(emplo9 Ima&inemos ;ue tenemos una serie de marcas de bebidas alco<licas -A: 8: " y D/ y ;ueremos saber la eCistencia de similitud entre marcas. 'Cisten varios m#todos para medir la similitud entre marcas. %odr.amos por e(emplo: comparar por pare(as: es decir A con 8: lue&o A con ": etc.

%ara poder realiBar este estudio: creamos una tabla de doble entrada y determinamos un orden de similitudes: por e(emplo9 Marca A Marca Marca Marca Marca A 8 " D Marca 8 ! Marca " $ 4 Marca D 5 * 0

Mna veB asi&nadas las similitudes: comprobamos ;ue esta ordenacin es dif.cil de apreciar una veB dispuesta esta informacin en forma de tabla. %odr.amos utiliBar un .ndice estad.stico para ordenar los datos: colocando el orden de similitud entre las marcas: midiendo #stas de una forma ms ob(etiva mediante las distancias entre marcas9 D A0 " A! 1 A ! 8 0

'n el &rfico anterior: si se puede apreciar me(or las distancias eCistentes entre similitud de marcas. %or e(emplo: la 8 y la D son las marcas mas distanciadas tal y como se puede comprobar en la tabla de doble entrada anterior: ya ;ue tienen un valor i&ual a *. 'n el &rfico anterior: estar.amos observando una >nica dimensin al estar las marcas dispuestas <oriBontalmente. i ;uisi#ramos utiliBar dos dimensiones: podr.amos incluso me(orar el nivel de percepcin9 %imensi-n 3 A O %imensi-n 0 C % 4esumiendo9 'ncuesta con escala nominal -dicotmicas/: es decir: mutuamente eCcluyentes !e"inicin % o'3eti+o del A<C. Determinaci n de Atributos y 5b(etos Mapa de posicionamiento. "olocar atributos &rficamente.

El an"lisis factorial de correspondencias #A>C$ es una tcnica de interdependencia descriptiva que representa gr"ficamente mediante filas

y columnas una ta!la de contingencia, !as"ndose en la descomposici-n de la Chi/cuadrado. 5tra definicin9 's una representacin &rfica y podemos ver esa representacin &rfica entre ob(etos y atributos de una forma muy sencilla. *a Chi/cuadrado #C3$ es una medida estandarizada de las frecuencias o!servadas de cada celda con las frecuencias esperadas de celdas. *os valores de la C3 pueden convertirse en medidas de similitud. El o!jetivo principal del A>C es identificar afinidades entre categor&as de filas y columnas presentadas en forma de ta!la, tanto de frecuencias como de valores medios. *as ventajas principales del A>C son' 1. su capacidad para representar relaciones entre categor&as de datos nominales con filas y columnas en un mismo espacio. 3. El A>C difiere de otras tcnicas de interdependencia en su capacidad para utilizar tanto datos no mtricos como relaciones no lineales. Conce&tos '(sicos del A<C. A partir de la ta!la de contingencia, se calcula una matriz de covarianzas de las varia!les columna, que luego se factoriza aplicando el An"lisis de Componentes 1rincipales. *as ra&ces y los vectores caracter&sticos que se o!tienen permiten calcular las coordenadas de las varia!les filas y columnas. *a correlaci-n de cada varia!le con cada uno de los ejes factoriales o!tenidos depende del valor de la coordenada respecto del eje considerado y las restantes coordenadas con los dem"s ejes. *a medida de la asociaci-n entre varia!les filas y columnas viene dada por la inercia -concepto del D2A3'/#variaci-n eCplicada del modelo$ total. *a inercia es el resultado de dividir el valor de la C3 de la ta!la por la suma total de frecuencias. Cada factor o!tenido contri!uye a la inercia en forma decreciente, de modo que el primer factor es el que mayor inercia explica, luego el segundo, y as& sucesivamente. %entro de cada eje o factor, la contri!uci-n a la inercia de cada varia!le est" en funci-n de los valores de su coordenada y de la frecuencia total de la varia!le columna o fila correspondiente. (i dos filas #columnas$ tienen perfiles pr-ximos, es decir, los porcentajes de las filas #columnas$ de am!as son parecidos, aparecer"n pr-ximos so!re el grafico. (i aparecen alejados tienen perfiles diferentes.

Su&uestos del A<C. El uso del A>C tiene una relativa li!ertad respecto a sus supuestos !"sicos. (e pueden utilizar tanto datos no mtricos como relaciones no lineales. *os supuestos del A>C se centran principalmente en la compara!ilidad y representatividad de los o!jetos que est"n siendo evaluados y de los encuestados. 'l proceso de muestreo es clave -a la <ora de seleccionar los ob(etos ms representativos/ cuando se aplica en el mundo real. 'n el e(emplo de las marcas: tenemos siempre ;ue seleccionar las ms representativas.

!ise$o del A<C. %eterminaci-n del o!jetivo del estudio. Compro!aci-n de los supuestos del A>C. Creaci-n de una ta!ulaci-n cruzada de entradas no negativas. C"lculo de la C3 6dentificaci-n del n mero apropiado de dimensiones. .l n8mero m#imo de dimensiones es igual al n8mero ms peque9o de filas o columnas menos uno. Por e6emplo! si una variable dispone de cinco categor)as " la otra de cuatro! el n8mero m#imo de dimensiones es tres. Creaci-n del mapa perceptual. -"on dos e(es para realiBar el posicionamiento/ 6nterpretaci-n y validaci-n.

M#todo de validacin9 7os investi&adores deben evaluar la sensibilidad de los resultados. ?"omoU "on la adicin o sustraccin por e(emplo de un ob(eto: podemos saber si el anlisis es dependiente de ese ob(eto en concreto y no de la relacin de este con los dems. i los datos cambian drsticamente: ;uiere decir ;ue evidentemente ;ue no <emos ele&ido los ob(etos correctamente.

Casos &r(cticos con !>ANE.


ANALISIS <ACTORIAL !E CORRES0ON!ENCIAS A<C1

%ara este e(ercicio: se <a utiliBado el fic<ero "5M%54T.D2T: fic<ero de e(emplo del D2A3' v0.1. Mna veB abierto este fic<ero en D2A3': obtenemos el anlisis factorial por correspondencias -A)"/

'le&imos la opcin TA87A D' )4'"M'3"IA 9

Despu#s seleccionamos las variables fila y columna. 7as variables fila tienen ;ue se&uir una ' "A7A 35MI3A7. 'n este caso las variables son DI"5T[3MI"A - I o 35/. 7as variables columna: <an de se&uir una ' "A7A "AT'P[4I"A. 'l n>mero de 'Z' -DIM'3 I53' / difiere de la definicin dada por el profesor. 'sto es debido a ;ue D2A3' tiene en cuenta otros factores para calcular dic<os 'Z' . %or lo tanto: lo calculado en D2A3' tambi#n es vlido.

'n este caso: ele&imos como variables fila TA4Z'TA: AMT5M56 y 6I6I'3DA. "omo variables columna: ele&imos "7A 5".

TABLA DE FREC<ENCIAS:

1 2 3 4 5 6

TAR3ETA -SJ TAR3ETA -N' A<TOMOV -SJ A<TOMOV -N' VIVIENDA-SJ VIVIENDA-N'

CLASSOC ----------------------------------A+ aP-% M%$ M% $"a a+ a "a -%$"a $"a 6aGa BaGa -------- -------- -------- -------27 110 54 2 74 112 324 11 14 135 135 17 67 173 303 76 112 123 211 31 41 125 211 62 3I-C<ADRADO: E3E 1 E3E 2 E3E 3 241;2172

INERCIA TOTAL:

0;023073

6alores de la

Inercia y la "<iA"uadrado Dimensiones o e(es


AUTOVALORES

obtenidos
VALORES PROPIOS: CONTRIB<CION A LA INERCIA: VECTORES PROPIOS: -------- -------- -------0;0212 0;0012 0;0000 12;5171 1;6115 0;5720 -0;6102 -1;5723 1;4241 -0;1101 -0;3524 0;2711 -2;5267 0;0522 -1;5211 1;3323 -0;2121 -0;7672

7os e(es ! y 0 son los


AUTOVECTORES

ms representativos. 'l e(e $ es i&norable.

4esumiendo9 7os e(es ! y 0 representan el 99:5S de la informacin. 'n este caso: se puede despreciar la informacin proporcionada por el e(e $: siempre ;ue no se necesite verdaderamente esta informacin para el estudio ;ue ;ueramos elaborar.
EST<DIO DE LAS COL<MNAS ----------------------3 ----------------------

-S de inercia eCplicada para cada e(e/


E 3 E 1 E 3 E 2 E 3 E ----------------------

----------------------

9 INER; EXPLIC; -----1; A+ aP-%$"a a+ a 37;25 2; M%$"a -%$"a 55;17 3; M%$"a 6aGa 2;10 4; BaGa 5;42 EST<DIO DE LAS FILAS -------------------3 ---------------------9 INER; EXPLIC; -----1; TAR3ETA -SJ 6;23 2; TAR3ETA -N' 2;11 3; A<TOMOV -SJ 43;40 4; A<TOMOV -N' 26;71 5; VIVIENDA-SJ 1;20 6; VIVIENDA-N' 11;74

COORDENADA -----0;424 0;164 -0;117 -0;450

CORRELACION -----0;111 0;111 0;177 0;162

9 INER; EXPLIC; -----46;07 10;02 20;26 22;11

COORDENADA ------0;007 -0;012 0;030 -0;021

CORRELACION -----0;000 0;006 0;023 0;032

9 INER; EXPLIC; -----0;52 3;16 33;24 62;23

COORDENADA ------0;011 0;001 -0;002 -0;005

CORRELACION -----0;000 0;003 0;000 0;000

E 3 E

E 3 E

E 3 E

---------------------COORDENADA -----0;671 -0;227 0;305 -0;122 0;173 -0;207 CORRELACION -----0;113 0;113 0;114 0;114 0;140 0;140 9 INER; EXPLIC; -----46;35 15;70 14;47 2;10 6;64 7;15

---------------------COORDENADA ------0;056 0;011 0;011 -0;012 0;044 -0;052 CORRELACION -----0;007 0;007 0;004 0;004 0;051 0;051 9 INER; EXPLIC; -----22;11 7;41 4;03 2;42 21;07 34;22 COORDENADA -----0;006 -0;002 -0;013 0;002 0;005 -0;006 CORRELACION -----0;000 0;000 0;002 0;002 0;001 0;001

-"odificacin o eti;uetacin de las variables para su representacin &rafica/


REPRESENTACIN =RFICA DE LOS E3ES FACTORIALES ---------------------------------------------VARIABLES COL<MNA: C,$"5' S"5)"("&a$' ------ ---------------A A+ aP-%$"a a+ a B M%$"a -%$"a C M%$"a 6aGa D BaGa

VARIABLES FILA: C,$"5' S"5)"("&a$' ------ ---------------1 TAR3ETA -SJ 2 TAR3ETA -N' 3 A<TOMOV -SJ 4 A<TOMOV -N' 5 VIVIENDA-SJ 6 VIVIENDA-N'

EDES 1 8 29 \nicamente se miran los resultados de #stos 0 e(es ya ;ue la informacin proporcionada por el e(e $ es i&norable. 'n este &rfico: medimos la similutud ;ue puedan tener las variables aplicando un criterio

sub(etivo: dado ;ue somos nosotros los ;ue tenemos ele&ir dic<a simulitud: observando las variables directamente del &rfico. 3o tenemos ;ue olvidar ;ue la t#cnica del A)" mide el posicionamiento de las variables.
E3E 2 C BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB BBBBBBBBBBC A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A 5 A A 2 C A 3 A --------------------------------------4------------D-----------B---------------------A---------E3E 1 A A A A 6 A 1 A A D A A A La Ha!; D %* N !%+a&"')a$a &') +a 6 A A A A A A A A A A A A A A A A A A A A A A A A A A C BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB BBBBBBBBBBC

ANALISIS <ACTORIAL !E CORRES0ON!ENCIAS A<C

'ste e(ercicio se <a realiBado utiliBando el fic<ero A"TI]T'M%.D2T del D2A3' v0.1. 'sco&emos la opcin de Tabla de 6alores Medios del Anlisis )actorial por correspondencias en D2A3'9

'sco&emos !1 variables fila y ! variable columna. 7as variables fila si&uen una escala de 7iOert. 'l n>mero de e(es o dimensiones es $.

TABLA DE VALORES MEDIOS: PROMOCEA ----------------------------------T%!&%!a C4a! a Q4") a S%K a 721P228 722P238 723P248 724P258 -------- -------- -------- --------

1 2 3 4 5 6 7 2 1 10

LIBERAL ECSOLMER SOCIALIS COM<NISM EMPRECRE EMPREEXP BENEOB31 BENSOLAC BALESOCI MARLENEC

2;32 3;62 2;66 1;45 2;21 2;10 2;10 2;14 4;31 2;76 0;007324

2;77 3;40 2;67 1;53 3;27 1;23 2;57 2;00 4;47 2;23

2;72 3;31 2;62 1;56 2;76 1;73 3;37 2;27 4;20 2;07

3;12 3;34 2;37 1;62 3;11 1;76 2;63 2;05 4;21 2;02 0;7262

INERCIA TOTAL:

3I-C<ADRADO: E3E 1 E3E 2 E3E 3 -------- -------- -------0;0052 0;0017 0;0004 70;4465 1;5254 -0;5541 0;0602 -1;0123 23;6515 0;5212 0;1535 -1;6514 0;1277 5;1020 0;4711 -1;3212 -0;4635 1;3423

VALORES PROPIOS: CONTRIB<CION A LA INERCIA: VECTORES PROPIOS:

e puede despreciar la

informacin del tercer e(e

EST<DIO DE LAS COL<MNAS ----------------------3 ---------------------9 INER; EXPLIC; -----1; T%!&%!a 721P228 5;53 2; C4a! a 722P238 44;36 3; Q4") a 723P248 5;41 4; S%K a 724P258 44;71 EST<DIO DE LAS FILAS -------------------3 ---------------------9 INER; EXPLIC; -----1; LIBERAL 34;25 2; ECSOLMER 1;47 3; SOCIALIS 26;01 4; COM<NISM 10;30 5; EMPRECRE 16;17 6; EMPREEXP 3;61 7; BENEOB31 1;14 2; BENSOLAC 0;57 1; BALESOCI 5;01 COORDENADA ------0;016 0;030 0;021 -0;047 -0;143 0;062 0;044 0;022 0;001

E 3 E

E 3 E

E 3 E

---------------------COORDENADA -----0;114 -0;040 0;004 -0;071 CORRELACION -----0;157 0;404 0;004 0;220 9 INER; EXPLIC; -----62;51 7;71 0;01 21;60

---------------------COORDENADA -----0;022 0;040 -0;061 0;002 CORRELACION -----0;036 0;402 0;177 0;001 9 INER; EXPLIC; -----6;17 22;23 61;32 0;27 COORDENADA -----0;010 -0;022 -0;010 0;022 CORRELACION -----0;007 0;115 0;011 0;111

E 3 E

E 3 E

E 3 E

---------------------CORRELACION -----0;255 0;233 0;411 0;726 0;136 0;612 0;161 0;212 0;001 9 INER; EXPLIC; -----12;35 2;27 1;62 2;46 42;01 6;17 3;11 0;71 0;00

---------------------COORDENADA ------0;011 0;012 -0;006 -0;002 0;027 0;043 -0;017 -0;040 0;021 CORRELACION -----0;011 0;121 0;016 0;011 0;033 0;275 0;227 0;762 0;772 9 INER; EXPLIC; -----0;70 0;12 0;12 0;11 4;42 7;30 52;03 7;41 4;25 COORDENADA -----0;032 0;007 -0;034 0;022 -0;026 0;015 -0;007 0;006 -0;012 CORRELACION -----0;134 0;045 0;565 0;255 0;030 0;034 0;004 0;015 0;227

10; MARLENEC 1;31

0;117

0;712

22;34

0;052

0;112

16;47

0;002

0;004

REPRESENTACIN =RFICA DE LOS E3ES FACTORIALES ---------------------------------------------VARIABLES COL<MNA: C,$"5' S"5)"("&a$' ------ ---------------A T%!&%!a 721P228 B C4a! a 722P238 C Q4") a 723P248 D S%K a 724P258

VARIABLES FILA: C,$"5' S"5)"("&a$' ------ ---------------1 LIBERAL 2 ECSOLMER 3 SOCIALIS 4 COM<NISM 5 EMPRECRE 6 EMPREEXP 7 BENEOB31 2 BENSOLAC 1 BALESOCI 10 MARLENEC

E3ES 1 @ 2: E3E 2 C BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB BBBBBBBBBBC A A A A A A A A A A A A A A A A A A A A A A A A 10 A A A A A B A 6 A A A A A 5 1 A A A A A A D A 2 A --------------------------------------------------D--------------------------------------------E3E 1 A 1 4 A 3 A A A A A A A A A A A A 2 A A A A A A A A A A A AC A A A A A A A A A 7 A A A A A A A A A A A A C BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB BBBBBBBBBBC

ANALISIS <ACTORIAL !E CORRES0ON!ENCIAS A<C#

MtiliBamos el fic<ero A"TI]'M%.D2T con el fic<ero A)"!.T87: ambos vienen con D2A3' v0. 'n este e(ercicio: ele&imos TA87A ' %'"K)I"A -IAD =5"J/.

'n entrada de datos: ele&imos la tabla A)"!.T87: ;ue est definida previamente.

TABLA: I$%a+ OP!aH"a Sa)%K Ta& ' -------- -------- -------- -------1;00 3;00 4;00 6;00 1;00 3;00 4;00 5;00 1;00 2;00 6;00 5;00 1;00 5;00 5;00 5;00 1;00 5;00 5;00 6;00

1 2 3 4 5

O"$!a a) Na 4!a+ D%!-'.!' N' $% %! P"%+*4aH

6 7 2

R%&a-6"' O+'! a5! E&'),-"&

6;00 2;00 7;00 0;055217

3;00 5;00 2;00

1;00 2;00 1;00

2;00 5;00 1;00 2;6217

INERCIA TOTAL: VALORES PROPIOS:

3I-C<ADRADO: E3E 1 E3E 2 -------- -------0;0351 0;0157 63;4315 0;5563 1;2074 -1;6170 -0;6573 22;4557 -0;1120 1;3625 -0;2115 1;0204

CONTRIB<CION A LA INERCIA:

'sco&emos las dos

dimensiones
VECTORES PROPIOS:

EST<DIO DE LAS COL<MNAS -----------------------

1; 2; 3; 4;

I$%a+ OP!aH"a Sa)%K Ta& '

E 3 E 1 ---------------------COORCORRE- 9 INER; DENADA LACION EXPLIC; ------ ------ -----0;104 0;404 13;01 0;226 0;512 26;00 -0;312 0;121 51;36 -0;123 0;374 1;63

E 3 E 2 ---------------------COORCORRE- 9 INER; DENADA LACION EXPLIC; ------ ------ ------0;125 0;524 41;27 0;172 0;341 33;40 -0;037 0;012 1;52 0;122 0;404 23;21

EST<DIO DE LAS FILAS --------------------

1; 2; 3; 4; 5; 6; 7; 2;

O"$!a a) Na 4!a+ D%!-'.!' N' $% %! P"%+*4aH R%&a-6"' O+'! a5! E&'),-"&

E 3 E 1 ---------------------COORCORRE- 9 INER; DENADA LACION EXPLIC; ------ ------ ------0;016 0;427 3;65 -0;061 0;522 1;21 -0;275 0;211 30;12 -0;030 0;052 0;40 -0;055 0;201 1;31 0;321 0;116 23;51 0;110 0;537 13;16 0;351 0;557 25;21

E 3 E 2 ---------------------COORCORRE- 9 INER; DENADA LACION EXPLIC; ------ ------ -----0;004 0;001 0;01 -0;045 0;221 1;71 -0;131 0;125 15;31 0;063 0;247 3;22 0;101 0;661 10;32 -0;011 0;001 0;06 0;161 0;423 23;02 -0;320 0;441 45;60

REPRESENTACIN =RFICA DE LOS E3ES FACTORIALES ---------------------------------------------VARIABLES COL<MNA: C,$"5' S"5)"("&a$' ------ ---------------A I$%a+ B OP!aH"a C Sa)%K D Ta& ' VARIABLES FILA: C,$"5' S"5)"("&a$' ------ ---------------1 O"$!a a) 2 Na 4!a+ 3 D%!-'.!' 4 N' $% %! 5 P"%+*4aH 6 R%&a-6"' 7 O+'! a5! 2 E&'),-"&

E3ES 1 @ 2: E3E 2 C BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB BBBBBBBBBBC A A A A A A A A A A A 7 B A A A A A A A A D A A A A A A 5 A A A A A A 4 A A A A A A A A A A A ---------------------------------------1----------D--------------------------------------------E3E 1 A A 6 A A C A A A 2 A A A A A A A A A A A A A A A 3 A A A A A A A A A A A A A A A A A A A A A A A A A A 2 A C BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB BBBBBBBBBBC

E3ercicio # 1. .#plica dos venta6es principales del uso del 23(. 2. /enciona una de las precauciones que ,a" que tener en el uso del 23(. 3. Define " relaciona los siguientes trminos$ la (,i:cuadrado " la inercia. '. (mo se puede determinar el n8mero m#imo de dimensiones en el 23(? *. ;e efectu un estudio emp)rico sobre la relacin entre las diversas clases sociales " la posesin de tar6eta de crdito! automvil! " vivienda. 4a clase social se clasific en cuatro tipos! 011 alta<media alta! 021 media media! 031 media ba6a! " 0'1 ba6a. especto a la posesin de cada atributo 0es decir! de tar6eta de crdito! automvil o vivienda1! se asign una de las dos categor)as siguientes$ =s) tengo> 0n8mero =1>1 o =no tengo> 0n8mero =?>1. &nterpreta lo que indican los siguientes datos " e#plica cmo se crea una representacin grfica.

7. &nterpreta lo que indica la siguiente epresentacin grfica.

+. ,&plica dos venta-es principales del uso del A.C. /. Menciona una de las precauciones ue *a% ue tener en el uso del A.C. 0. Define % relaciona los siguientes t!rminos: la C*i1cuadrado % la inercia. 2. Cmo se puede determinar el n3mero m&imo de dimensiones en el A.C" 4. 5e efectu un estudio emp(rico sobre la relacin entre las diversas clases sociales % la posesin de tar-eta de cr!dito$ automvil$ % vivienda. 6a clase social se clasific en cuatro tipos$ 7+8 alta9media alta$ 7/8 media media$ 708 media ba-a$ % 728 ba-a. #especto a la posesin de cada atributo 7es decir$ de tar-eta de cr!dito$ automvil o vivienda8$ se asign una de las dos categor(as siguientes: :s( tengo; 7n3mero :+;8 o :no tengo; 7n3mero :<;8. Interpreta lo ue indican los siguientes datos % e&plica cmo se crea una representacin grfica.

'l e(e ! eCplica el 9,S de la inercia: casi su totalidad. %rescindimos del tercero por;ue aporta poco a la inercia. De las cate&or.as: la clase mediaNalta eCplica mayor 4epresenta de la inercia -4*:1+S/.

=. Interpreta lo ue indica la siguiente #epresentacin grfica.

A la <ora de interpretar u n mapa de posicionamiento debemos tener en cuenta si los datos estn en la parte positiva o ne&ativa: no tiene importancia. 'n lo ;ue <ay ;ue fi(arse es en la distancia entre los datos y a&rupar los ob(etos ;ue est#n ms cerca. 7os atributos eCplican las caracter.sticas de esas a&rupaciones. : : : i estn prCimos los perfiles son similares. i estn ale(ados: los perfiles son distintos. i su valor es la media: se proyectar sobre el e(e de ordenadas i est ale(ado el ori&en: su comportamiento ser distinto del resto y su contribucin a la inercia ser mayor.

=ay ;ue (ustificar las interpretaciones: ese es el peli&ro ;ue tenemos al usar t#cnicas interdependientes. 'n el &rfico podemos ver 4 &rupos. e comprueba la asociacin de los atributos observados a los encuestados con las diversas marcas de automvil. 1. 0. $. '. %olo Asociacin con los atributos ms cercanos. IbiBa y "l.o %unto: aCo y "orsa. )iesta y %!1* no puedo captar suficientes atributos para describirlos.

'n concreto: este mapa no es muy fiable: no nos podemos fiar de los resultados de este estudio ya ;ue el atributo amplitud est muy cercano al corsa: punto y saCo: ;ue son coc<es pe;ueos. %or lo ;ue el cliente no estar.a de acuerdo con los resultados.

TEMA ): EL ANALISIS CLUSTER

Estructura de la clase: 1. Introduccin. . !e"inicin % o'3eti+o del AC. #. Conce&tos '(sicos del AC. ). Su&uestos del AC. ,. !ise$o del AC. -. Casos &r(cticos con !>ANE. Introduccin. En estad&stica, la ! squeda de o!jetos relativamente homogneos se denomina +an"lisis cluster, -"on&lomerados o &rupos. Tienen ;ue ser <omo&#neos internamente y <etero&#neos entre los &rupos/. *as aplicaciones del an"lisis cluster al mar@eting son m ltiples. 1or ejemplo, se utiliza mucho en el campo de la segmentaci-n. El origen de esta tcnica multivariante se encuentra en la !iolog&a y la !ot"nica. *os investigadores de estas "reas de conocimiento ten&an que agrupar las distintas especies de animales y vegetales en familias que fueran lo m"s homogneas posi!les. 1or ello, a esta tcnica tam!in se la denomina construcci-n de tipolog&a, taxonom&a numrica o an"lisis de clasificaci-n. Ejemplo ilustrativo' Ima&inemos ;ue <emos realiBado una serie de encuestas para saber unaNs caracter.sticaNs de consumidores de &randes superficies ms representativas en la ""AA de Madrid. Al representar &rficamente los datos obtenidos: lo <aremos sobre dos e(es donde cada e(e ten&a sus medidas estandariBadas.

8sicamente consiste en a&rupar: en este caso: los consumidores en &rupos <omo&#neos entre s. y para formar los &rupos o cl>sters : y para ello vamos encontrando las distancia m.nima entre los puntos o consumidores.

!e"inicin % o'3eti+o del AC. El an"lisis cluster se puede definir como una serie de tcnicas estad&sticas (grupo de tcnicas) que sirven para determinar grupos internamente homogneos (heterogneos), pero distintos entre s&. El o!jetivo principal del AC es la o!tenci-n de grupos internamente homogneos y distintos entre s& !as"ndose en su similitud para un conjunto de caracter&sticas especificadas. A cada uno de estos grupos se le denomina +conglomerado, o +cluster,. Con estos grupos homogneos, podemos conseguir los siguientes o!jetivos espec&ficos' #0$ (implificaci-n de los datos e identificaci-n de las relaciones entre los conglomerados o clusters. #3$ Confirmaci-n de una taxonom&a o tipolog&a propuesta. 'l A" funciona me(or cuando tenemos una teor.a espec.fica. %or e(emplo9 consumidores divididos en cinco &rupos. 2 se <ace as. por estudios previos. Conce&tos '(sicos del AC. El an"lisis cluster es la nica tcnica multivariante que no estima el valor te-rico emp&ricamente sino que utiliza el valor te-rico especificado por el investigador. MM2 IM%54TA3T'9 omos nosotros los ;ue estimamos el valor terico. (e de!e incluir s-lo aquellas varia!les que caracterizan los o!jetos que se est"n agrupando y que son coherentes con el o!jetivo del estudio. %icha coherencia de!e !asarse en una teor&a expl&cita, investigaci-n previa o suposici-n propia. 1ara formar los conglomerados o clusters homogneos hay que seguir tres pasos' #0$determinaci-n del mtodo de medici-n de la similitud entre los o!jetos. -Medir la distancia entre dos puntos/ #3$determinaci-n del mtodo de conglomeraci-n jer"rquica o no jer"rquica. -"on&lomeracin si&nifica a&rupacin/ #4$determinaci-n del n mero de conglomerados o clusters en la soluci-n final. Su&uestos del AC. 7as variables a utiliBar en el A" son m#tricas. *os supuestos generales -linealidad: normalidad y <omocedasticidad/ tienen en general poco peso en el AC. 5o o!stante, hay dos supuestos espec&ficos que s& son importantes'

a$ *a representatividad de los datos' *a !ondad del AC depende mucho de la representatividad de la muestra, y es muy sensi!le a los casos at&picos. !$ El nivel de multicolinealidad' *a multicolinealidad es #una medida por la cual una variable puede ser eCplicada por otras variables. 'l nivel de multicolinealidad implica ver el nivel de independencia entre las variables. $. Cuanto mayor es la multicolinealidad del an"lisis, m"s dif&cil es interpretar los resultados del an"lisis, porque es m"s dif&cil sa!er cu"l es el efecto de una varia!le aislada de!ido a las interrelaciones entre las varia!les. 2ay dos mtodos para evaluar el nivel de multicolinealidad' #0$N6> #factor de inflaci-n de la varianza$. #3$8olerancia. 'stos dos .ndices se vern me(or en el modelo de re&resin lineal m>ltiple.

!ise$os del AC. 1ara dise.ar un AC hay que seguir los siguientes pasos' !eter*inar o'3eti+os del AC. -4evisin biblio&rfica/ Seleccionar las +aria'les % ase1urar su re&resentati+idad. E9a*inar los su&uestos. !etectar los at5&icos. E9a*inar el ni+el de *ulticolinealidad. !eter*inar el *.todo de *edicin de distancia o si*ilitud. !eter*inar el &rocedi*iento de o'tencin de con1lo*erados o clusters. !eter*inar el n=*ero de con1lo*erados o clusters. Inter&retacin % +alidacin de los resultados. !eter*inar o'3eti+os del AC: Yu# ;ueremos averi&uar de esta t#cnica.

Seleccin de +aria'les rele+antes -representativas/: Existen fundamentalmente tres mtodos de selecci-n de varia!les' inductivo, deductivo y cognitivo. En el *.todo inducti+o -intuitivo/, ni las varia!les ni el n mero de grupos tienen un nexo con una teor&a. (e utiliza m"s en estudios exploratorios. En el *.todo deducti+o, la selecci-n de varia!les se apoya en la literatura te-rica existente. *a consistencia interna de los grupos resultantes es mayor ya que no se incluyen varia!les irrelevantes. En el *.todo co1niti+o se utilizan las predicciones de determinados expertos de la industria para definir las varia!les. MtiliBacin de los factores. e pueden utiliBar los factores del A"%.

E9a*inar los su&uestos: %etectar los at&picos 5ivel de multicolinealidad. !eter*inar el *.todo de *edicin de si*ilitud:

El concepto fundamental del an"lisis cluster es +la si*ilitud,. *os casos pueden ser agrupados conforme a la similitud o distancia entre o!jetos. Existen varias medidas de distancia. *a m"s utilizada es la distancia Eucl&dea. La distancia Eucl5dea entre los puntos es la longitud de la hipotenusa de un tri"ngulo, calculada por la f-rmula'

D istancia

=0

1 12 + 0 y2 y1 1 2

La distancia Eucl5dea al cuadrado tiene la ventaja de no tener que tomar la ra&z cuadrada lo que acelera nota!lemente los c"lculos, y es la medida de distancia recomendada para los m#todos de anlisis cluster del centroide y Xard. T Distancia de Ma<alanobis

!eter*inar el con1lo*erados:

&rocedi*iento

de

o'tencin

de

(e trata de c-mo elegir formas de com!inar los o!jetos. Hlo!almente, hay dos procedimientos' 11 0rocedi*ientos 3er(rJuicos' Consisten en la construcci-n de una estructura en forma de "r!ol. 21 0rocedi*ientos no 3er(rJuicos -Anlisis "luster LAmeans/' Asignan los o!jetos a conglomerados una vez que el n mero de conglomerados a formar est" especificado, !as"ndose en la ! squeda de la mejor soluci-n. !^ ver las distancias y despu#s incluir los puntos de esa distancia. 's un procedimiento matemtico. IM%54TA3T'9 'n D2A3' slo est el -!/. 'n % estn el -!/ y el -0/. %entro del procedimiento jer"rquico, existen varios agrupaci-n'

mtodos

de

11 M!todo aglomerativo o modelo ascendente 0por e6emplo! 2lgoritmo de @o,nson1$ "ada ob(eto empieBa dentro de con&lomerado. 7os ob(etos ms cercanos se combinan en con&lomerados a&re&ados reduciendo as. el n>mero de con&lomerados. 'st implementado as. en D2A3'.

21 M.todo di+isi+o o *odelo descendente #por ejemplo, Algoritmo de 2oZard/2arris$' 'mpeBamos con un &ran con&lomerado ;ue contiene todas las observaciones con los ob(etos. 'n pasos sucesivos: los ob(etos se van dividiendo donde despu#s se constituyen con&lomerados ms pe;ueos <asta ;uedar los con&lomerados bsicos: diferenciados entre s..

!entro del *.todo a1lo*erati+o o *odelo ascendente7 4a% +arios *.todos de encadena*iento. L61 !5$6+61 !>1 %!96($')$*1 16) #61 $(*1 9(%!*(61. 11 Encadena*iento si*&le' (e !asa en la distancia m&nima entre los dos casos. 21 Encadena*iento co*&leto' (e !asa en la distancia m"xima entre los dos casos. 'ntre todas las distancias mCimas eCistentes. 31 Encadena*iento &ro*edio' (e !asa en la distancia media de todos los casos.

'1 Encadena*iento de Lard: Calcula la media de todas las varia!les de cada cluster, y luego calcula la distancia eucl&dea al cuadrado entre cada indiviuo y la media de su grupo, etc. *1 Encadena*iento del centroide: Distancia entre los centroides de los con&lomerados.

!eter*inar el n=*ero de con1lo*erados: El resultado de la agrupaci-n se suele resumir en una matriz de distancias. En la matriz de distancias, podemos decidir cuantos clusters se necesitan comparando las distancias entre los casos. 7tra forma de visualizar la representaci-n de los pasos en un an"lisis jer"rquico es el dendrograma. El dendro1ra*a *uestra el cluster Jue es co*'inado % los +alores de los coe"icientes en cada caso. El dendrograma se lee de izquierda a derecha. E9isten tres criterios Jue &ueden a%udar al in+esti1ador a to*ar una decisin relati+a al n=*ero &ti*o de 1ru&os a "or*ar: #0$ Dendo&rama.

#3$ Matemticamente determinar el n>mero de con&lomerados.

#4$ 8ase terica. 4evisar estudios previos. "on esta base terica -estad.stica de fuentes secundarias/ podemos dividir las observaciones para obtener un determinado n>mero de clusters.

Inter&retacin % +alidacin de los resultados: 7a validacin del A": de la misma manera ;ue en el A"%: se puede realiBar escindiendo la muestra en dos &rupos. "ada con&lomerado se analiBa por separado y se comparan despu#s los resultados. Tambi#n: =air et al. -!99,/ eCplica ;ue _la aproCimacin ms directa es realiBar el A" para muestras distintas. 'sta aproCimacin: sin embar&o: a menudo no es prctica debido a las restricciones de tiempo o de costes o a la no disponibilidad de ob(etos..._ -pp. 5!+/.

Casos &r(cticos con !>ANE.

E3ercicio ) 1. 2. 3. '. *. .#plica dos venta6as principales del uso del 2(. (ules son los pasos bsicos en la obtencin de clusters? Define " relaciona los siguientes trminos$ la similitud " la distancia .ucl)dea. .#plica c-mo elegir formas de com!inar los o!jetos. .#plica en qu consiste el =encadenamiento completo> utili+ando el siguiente cuadro.

/atri+ de distancias eucl)deas A B A B C D E , $ #, $# & , $+ $$ $)

, ' #' , #( ,

+. ,&plica dos venta-as principales del uso del AC. !/ implificar los datos e identificar las relaciones entre los con&lomerados o clusters 0/ "onfirmar una taConom.a o tipolo&.a propuesta 'l Anlisis "luster funciona muc<o me(or cuando tenemos una base terica. Ten&o una taConom.a clasificable: como por e(emplo una taConom.a en la ;ue se puedan dividir en &rupos del tipo IAlumnos ;ue no <an entre&ado el traba(o de ITMJ: IAlumnos ;ue <an entre&ado el traba(o la semana pasadaJ: IAlumnos ;ue <an entre&ado el traba(o la >ltima semanaJ

/. Cules son los pasos bsicos en la obtencin de clusters" %or definicin el A" es un con(unto de t#cnicas de clasificacin de ob(etos y no una sola. %or eso nos centramos en tres pasos. !^.A 3os centramos en la determinacin del m#todo de medicin de la similitud entre los ob(etos. A;u. nos <emos marcado la distancia eucl.dea como indicador 0^.A Determinacin del m#todo de "on&lomeracin Zerr;uica o 3o Zerr;uica -el 3o Zerr;uico no lo estudiaremos este ao/. 'l procedimiento ideal del A" es utiliBar el m#todo Zerr;uico y obtener los resultados: y lue&o validar estos resultados con el m#todo 3o Zerr;uico. $^.A Determinar el n^ de con&lomerados o clusters en la solucin final. ?"moU =ay $ m#todos para determinar el n^ de clusters9 a/ 'n los m#todos Zerr;uicos: el criterio ms usado es la observacin del dendo&rama. b/ %odemos utiliBar medidas matemticas. "alcular matemticamente el n^ de con&lomerados: pero esto no lo <emos visto. c/ 4ecomendado9 7a eCistencia de una teor.a previa. %odemos proponer un modelo mediante estudios previos o datos estad.sticos de la industria o los art.culos de eCpertos del rea. "on esto proponemos la base terica.

0. Define % relaciona los siguientes t!rminos: la similitud % la distancia ,ucl(dea.

Son conceptos principales del An!lisis Cluster"

DistanciaA;imilitud

%ara medirlo se utiliBa la distancia eucl.dea9 %istancia A 8sicamente <ablamos de ob(etos para clasifica y a&rupar un con&lomerado. Tenemos ;ue medir la distancia: y esta distancia es sinnimo de similitud:. %ara medir la distancia matemticamente usamos el concepto de distancia eucl.dea. 7a similitud es un concepto fundamental del anlisis cluster: en base a los cual pueden ser a&rupados. 'sencialmente: la similitud es sinnimo de distancia entre ob(etos. 7a ms utiliBada es la distancia 'ucl.dea. 7a Distancia 'ucl.dea entre dos puntos es la lon&itud de la <ipotenusa de un trian&ulo: y se calcula as.9 Distancia E
0 $ 2 $ 11 2 +0# 2 # 11 2

'. ,&plica c*o ele1ir "or*as de co*'inar los o'3etos. Plobalmente: <ay dos procedimientos del anlisis cluster9 P(62*+%!%*)$61 C*(>(<"%261 8 P(62*+%!%*)$61 N6 C*(>(<"%261: Dentro del (err;uico: eCisten varios m#todos de a&rupacin9 !/ M#todo a&lomerativo o modelo ascendente -Al&oritmo de Zo<nson en Dyane/. 'n este m#todo: cada ob(eto o observacin empieBa dentro de su propio con&lomerado. 'n etapas ulteriores los dos con&lomerados ms cercanos se combinan en un nuevo con&lomerado a&re&ado: reduciendo as. el n>mero de con&lomerados paso a paso 0/ M#todo divisivo o modelo ascendente -Al&oritmo de =o`ardA=arris en Dyane/ 'mpeBamos con un &ran con&lomerado ;ue contiene todas las observaciones y en los pasos sucesivos las observaciones ;ue son mas diferentes se dividen y se construyen con&lomerados ms pe;ueos. 'tc. @. -'sto esta en el es;uema del tema 4/

4. ,&plica en u! consiste el :encadenamiento completo; utili)ando el siguiente cuadro.


Matri0 de distan$ias e $l4deas

A > C D ,

A ? 1 2? 12 C

> ? 1' 11 1B

C ? * 2*

? 23

!/ %rimeramente <ay ;ue identificar entre ;ue variables la distancia es m.nima9 'n este e(emplo: la distancia m.nima se da entre A y 8. %or ello: se a&rupar.an estos dos casos. 0/ Despu#s de a&rupar los dos casos: <ay ;ue formar una nueva matriB de combinaciones como la si&uiente9 A> ? ? ? ? C ? * 2* D ? 23 ,

A> C D ,

$/ A<ora <ay ;ue calcular las distancias m.nimas con la nueva matriB de combinaciones mediante el encadenamiento completo9 D-A8/" E MaC -dA a ": d8A"/ E MaC -01: !4/ E 01 D-A8/D E MaC -dA a D: d8AD/ E MaC -!0: !!/ E 01 D-A8/' E MaC -dA a ': d8A'/ E MaC -+: !,/ E !, 4/ 7a nueva matriB de distancias es A> C D , A> ? 2? 12 1B C ? * 2* D ? 23 ,

A<ora repetimos el proceso con esta nueva tabla. 7a distancia m.nima se da ente " y D. %or ello: se a&rupan estos dos casos. A> CD ,

A> CD ,

? ? 1B

? ?

D-A8/-"D/ E MaC -dA8A": dA8AD/ E MaC -01: !0/ E 01 D-"D/' E MaC -d"A': dDA'/ E MaC -05: 0$/ E 05 - iempre <ay ;ue calcular las distancias para a&rupar los casos. 2 esto siempre mirando la matriB anterior/ +/ 7a nueva matriB de distancias es9 A> CD , A> ? 2? 1B CD ? 2* , ?

7a distancia m.nima se da entre A8 y ': ;ue es !,. 7a matriB final es9 A>, CD A>, ? CD 2* ? 3ota9 'l encadenamiento simple es i&ual pero con las distancias m.nimas en lu&ar de las distancias mCimos
&r5,i$o Dendo6rama

1B

2?

* 1

TEMA ,: LA REGRESIMN MULTI0LE

Estructura de la clase: 1. Introduccin. . !e"inicin % o'3eti+o. #. T.r*inos % conce&tos '(sicos de la RM. ). Su&uestos de la RM. ,. Ta*a$o *uestral. -. !ise$o de la RM. /. Casos &r(cticos con !>ANE % S0SS. Introduccin. 1.1 I)$(6+"22%4) G*)*('# "uando ;ueremos predecir una variable dependiente en funcin de unas variables independientes9 2 E 6ariable dependiente F! G F0 G@G Fn 6ariables independientes

!. "uando tenemos variables dependientes M'T4I"A : y variables independientes M'T4I"A : tenemos ;ue utiliBar 4e&resin M>ltiple. Tenemos solamente M3A variable dependiente m#trica y varias independientes M'T4I"A . 0. "uando tenemos una variable dependiente 35 M'T4I"A: y variables independientes M'T4I"A : usaremos el Anlisis Discriminante. $. "uando tenemos 6A4IA variables dependientes M'T4I"A : y tenemos una serie de variables independientes 35 M'T4I"A : a;u. usaremos MA356A. 4e&resin 7o&.stica se usa cuando tenemos una variable dependiente nominal. %ara Anlisis Discriminante podemos utiliBar una variable cate&rica: no tiene ;ue ser dicotmica. 'n la re&resin lo&.stica se usa cuando la variable cate&rica es nominal: es decir dicotmica: con dos valores: por e(emplo I o 35.

1.2 I)$(6+"22%4) R*3(*1%6) M"#$%9#*

's bsicamente una t#cnica de prediccin. 1. =asta a<ora <emos estudiado la prediccin sin variables independientes: como son la utiliBacin de la media y la t#cnica A356A para la comparacin de medias. . Tambi#n <emos <ec<o prediccin con una >nica variable independiente. 'n este caso estamos utiliBando la t#cnica de 4e&resin imple: ;ue tiene una variable independiente y una variable dependiente. 's una re&resin lineal para predecir la tendencia de una poblacin. Mn concepto importante en la re&resin simple es la distancia entre el valor y la prediccin. A esto se le llama 'rror de %rediccin. 7a R*3(*1%4) M=#$%9#* es la continuacin de la 4e&resin imple: por eso usaremos los mismos conceptos.

Error de 1redicci-n

En la %egresi&n M'ltiple( tenemos )ue minimizar los errores de predicci&n"

!e"inicin % o'3eti+o de la RM. @A"5 *1 #' R*3(*1%4) M=#$%9#*B Msar las variables independientes cuyos valores son conocidos para predecir la >nica variable criterio seleccionada por el investi&ador 2 6ariable M#trica Dependiente E F! G F0 G@G Fn 6ariables M#tricas Independientes

*a 9M es una tcnica estad&stica que puede utilizarse para analizar la relaci-n entre una nica varia!le dependiente y varias varia!les independientes. 7!jetivos' #0$ MaCimiBar la potencia con(unta de prediccin de las variables independientes. #3$ 'Cplicar la relacin entre las variables dependientes e independientes al formar el valor terico.

T.r*inos % conce&tos '(sicos de la RM. Namos a estudiar los trminos y conceptos !"sicos de la 9M con un ejemplo. (upongamos que queremos predecir el porcentaje de paro so!re la po!laci-n #que es la varia!le dependiente >$, a partir del porcentaje de variaci-n de la po!laci-n en el per&odo 0GG0/GF, el nivel econ-mico, y la cuota de mercado de la provincia #que son las varia!les independientes G1 G y G# , respectivamente.
*ariable +ependiente *ariable ,ndependiente
(oeficiente de determinacin$ ?.'21D (oeficiente de correlacin m8ltiple$ ?.7'D* (oeficiente de regresin alfa$ 7.'?CC
D.;5&2(&G.;%J-D2 (E.3&(&.-%. .K .;&G. E .;%J-D2 % D. ;%FD.-% (E.3&(. (E .4. P2 (&24 ;F/2 D. (F2D 2DE; 2L2D&D2 P EPE (. 52 &2-H2 2L2D&D2

Coe-iciente de %egresi&n .eta E

Coe-iciente de Correlaci&n M'ltiple R

52 &2I4.

/.D&2

:::::::: :::::::::::::: :::::::::::::: ::::::::::: :::::::::: :::::::: ::::::: :::::::::::::::::::: :::::::: M Paro 0?1 3.D??? 1.1?C1 -ivel.co 0G11 *.1B?? 1.'?DB 237*.'3'D '.2DCC :?.*17C ?.???1 :?.?2?? ?.?D?? ?.???1 ?.?2D' :*.C'3* pA?.???? 1.BD*B pA?.?7'3 :?.7B23 pA?.'DB* :::::::::::::::::::: :::::::: 2*.B*21 ?.'21D 2-J4&;&; D. 42 52 &2-H2 ::::::::::::::::::::::: 3F.-%. D. 52 &2(&G- K 2DE; 4&I. %2D ;F/2 (F2D 2DE; :::::::::::::::::::::: ::::::::::::::: ::::::::::::::::::::: ::::::::::::::::::::: Debida a la regresin$ 3 2*.B*21 esiduo$ '7 3*.'2CD ::::: ::::::::::::::::::::: 5arian+a total$ 'D 71.2B?? 3 de ;nedecor con 3 " '7 grados de libertad A 11.1BBD 0pA ?.????1 /.D&2 (F2D 2DE; B.71C' ?.C :?.7'72 ?.27D2 :?.1??1 22.DD?D 2.*?27 ?.3*B* ?.3C*2 ?.?'?B ?.??*D

(uota/er 0 G 1 1DD3.D2?? M5arPobl 0 G#1 1.B3??

'l coeficiente de determinacin y el coeficiente de correlacin m>ltiple son coeficientes muy importantes para valorar el Anlisis de 4e&resin M>ltiple Mediante el valor de $ +* S$"+*)$ podemos rec<aBar o aceptar las variables independientes. Aceptar o rec<aBar las variables: depender del nivel de si&nificacin.

7os criterios para establecer el nivel de si&nificacin dependen de nuestra base terica. 'n nuestro modelo: si ;ueremos aceptar nuestro modelo para un nivel de si&nificacin de p E 1.!1: tendremos ;ue (ustificar por;ue usamos este nivel de si&nificacin. obre todo en estudios 'F%754AT54I5 -3o confirmatorios/: este nivel de si&nificacin es aceptable. 7a tercera parte de esta tabla <abla del A)>#%1%1 +* #' &'(%'),'. 7a ) de snedecor: trata la <iptesis de ;ue el porcenta(e de variacin eCplicada por el modelo es mayor ;ue la eCplicada por la media. 1ara realizar esta predicci-n suponemos que K se puede expresar como una com!inaci-n lineal de las varia!les independientes C0 C3 y C4 de este tipo' > N F OE1 G1 OE G O .... OEn Gn O *

b upon&amos ;ue ;ueremos predecir el S de paro sobre la poblacin -2 como variable dependiente/. Msaremos variables independientes para predecir esta variable dependiente ;ue <emos seleccionado. %ara <acer re&resin m>ltiple sobre el Dyane9

2 nos saldrn los valores de la tabla de arriba.c

Coe"icientes de re1resin al&4a 6F2: Es el valor constante que toma la varia!le dependiente K si las varia!les independientes C0 C3 y C4 valiesen
cero. Coe"iciente de re1resin 'eta 6E17 E 7P7 En2: Expresa el cam!io estimado en la varia!le dependiente K de!ido a un cam!io unitario de la varia!le independiente.

Error de &rediccin 6Residuo7 *2: Es la diferencia entre los valores reales y el valor de predicci-n de la varia!le dependiente K.
Error est(ndar: Es la desviaci-n t&pica de los errores de predicci-n.

I!96($')$*9 'l error estndar implica la precisin de la prediccin. Mn nivel de error estndar ms pe;ueo implica una prediccin ms se&ura o correcta. 7os dos si&uientes .ndices son ;uiBs los ms importantes para la interpretacin de los datos. Coe"iciente de correlacin *=lti&le 6R2: Es el coeficiente de correlaci-n de la regresi-n m ltiple de las varia!les independientes y la varia!le dependiente. 6ar.a entre 1 y !. e utiliBa para la interpretacin de los datos. Coe"iciente de deter*inacin 6R 2: Es el coeficiente de correlaci-n m ltiple al cuadrado.
'ste .ndice eCpresa la proporcin de la varianBa de la variable dependiente eCplicada por el modelo de re&resin m>ltiple. 6ar.a entre 1 y !. 'ste coeficiente esta influenciado por el n>mero de variables independientes relativas al tamao muestral. %or ello se a(usta la infraccin del coeficiente de determinacin y se calcula el C6*:%2%*)$* +* D*$*(!%)'2%4) AC"1$'+6 -R AC"1$'+6..

$ de Student: El coeficiente de regresi-n dividido por su error est"ndar. El valor t mide la significaci-n de la correlaci-n parcial de la varia!le reflejada en el coeficiente de regresi-n. 7a t de tudent se utiliB en el primer semestre para ver diferencias si&nificativas entre poblaciones. 7a parte ms importante de la t de tudent es ;ue tenemos ;ue utiliBar este .ndice para determinar si una variable independiente deber.a salir de la ecuacin una veB ;ue se <a aadido. 'stableceremos un nivel de si&nificacin.

'n la tabla de e(emplo tenemos el valor de la t de tudent: aun;ue el valor realmente importante es el valor de la p -probabilidad: si&nificacin estad.stica/. b i fi(amos un nivel de si&nificacin de p E 1.1111! slo fi(aremos una sola variable independiente: aun;ue nuestro planteamiento inicial es ;ue el S de paro depende de las otras variables tambi#n. As.: podemos cambiar nuestro nivel de si&nificacin: : para fi(ar un alfa E1.1!: 1.15: 1.!: y poder aceptar ms variables independientes. %or eso: para saber ;ue variables rec<aBar es muy importante mirar estudios anteriores. %or e(emplo nosotros creemos ;ue son los tres factores muy influyentes en el nivel de paro: y nosotros ;ueremos demostrar ;ue las $ influyen y las ;ueremos incluir en nuestro modelo para <acer la previsin. A pesar de eso: podemos observar los si&uientes valores9 p E 1.1111 si&nificativo p E 1.49,5 no si&nificativoc F de Snedecor: (e utiliza el an"lisis de la varianza para contrastar la hip-tesis de dependencia lineal entre la varia!le dependiente y las varia!les independientes. Es decir, el ratio > se utiliza para contrastar la hip-tesis de que la cantidad de variaci-n explicada por el modelo de regresi-n es m"s que la variaci-n explicada por la media #2air et al., pp. 0=?$. Yueremos saber si la variacin eCplicada por el modelo es mayor ;ue cero 40H1. Su&uestos de la RM. (upuestos generales' *inealidad, 6ndependencia de los residuos. 1. . 3. ).

5ormalidad,

2omocedasticidad,

Linealidad. Nor*alidad. :o*ocedasticidad: El test M de Oox #2air et al., B=$. Inde&endencia de los residuos.

(upuesto espec&fico' Ausencia de la multicolinealidad. 1asos a seguir' 11 0ri*er &aso: examinar la matriz de correlaci-n de las varia!les independientes para identificar la presencia de una elevada correlaci-n #generalmente de ;,G; o m"s$. 'l observar la matriB de correlaciones es bastante sub(etivo: por eso utiliBamos .ndices ob(etivos. %ara ello utiliBaremos dos .ndices ;ue

eCplicamos en el si&uiente punto9 'l &'#6( +* $6#*(')2%' y 'l $*1$ +*# :'2$6( +* %):#'2%4) +* #' &'(%'),' -VIF.. 21 Se1undo &aso: utilizar dos medidas estad&sticas para evaluar la colinealidad de m ltiples varia!les. Estas dos medidas son' El +alor de tolerancia: la cantidad de varia!ilidad de las varia!les independientes seleccionadas no explicadas por el resto de las varia!les independientes. Tn valor de tolerancia reducido denota una elevada colinealidad. El test del "actor de in"lacin de la +arian8a 6VI<2: es el inverso del valor de tolerancia. Tn valor del N6> elevado denota una elevada colinealidad. Nota: el valor de tolerancia por defecto en el (1(( para excluir una varia!le es ;,;;;0. Ta*a$o *uestral. 'l tamao de la muestra siempre es problemtico. 3o siempre podremos obtener un tamao muestral &rande o deseado. %ara la re&resin m>ltiple <ay una serie de re&las a se&uir: ;ue son las ;ue se eCplican a continuacin9 0$ El ratio de o!servaciones so!re las varia!les independientes nunca de!er&a caer por de!ajo de cinco.
/umerode0b servacione s /umerode var iablesdepe ndientes >*

3$ El nivel deseado est" entre 0: y 3; o!servaciones para cada varia!le independiente. 4$ *as muestras muy grandes, de 0.;;; o!servaciones o m"s, hacen los test de significaci-n estad&stica demasiado sensi!les, indicando que casi cualquier relaci-n es estad&sticamente significativa. !ise$o de la RM. 7!jetivos. 7o primero es establecer el ob(etivo del estudio: y lue&o (ustificar este ob(etivo. 8ama.o muestral. Tendremos ;ue (ustificar el tamao de la muestra.

(upuestos generales y espec&ficos. Estimaci-n del modelo. 6nterpretaci-n. %odemos eCaminar los coeficientes 8eta y averi&uar su importancia relativa en el valor terico de la re&resin m>ltiple. Dependiendo del pro&rama informtico: podremos obtener el coeficiente 40 a(ustado o corre&ido. 'sto es por;ue 40 esta influenciado por tamao muestral y por el n>mero de variables y n>mero de variables independientes. 'ntonces cuando comparamos el .ndice de determinacin y el de determinacin a(ustado y ambos son muy parecidos: si&nifica ;ue estamos construyendo el modelo correcto: nuestro modelo predice los valores correctamente. Nalidaci-n. Tenemos dos posibilidades de validacin9 !/ %odremos obtener otra muestra de la poblacin para evaluar la correspondencia de los resultados obtenidos de las dos muestras. 0/ %odemos dividir la muestra en dos submuestras: realiBar la re&resin m>ltiple para cada submuestra y comparar los resultados.

Casos &r(cticos con !>ANE % S0SS. !>ANE: Especificaci-n confirmatoria.


/.1. Caso &r(ctico 1 con !>ANE.

"on la si&uiente base de datos de Dyane: <emos realiBado el e(emplo ;ue se muestra a continuacin.

C'[%ocum ents and (ettings[eG=::?[Escritorio[9afa[Est\1rov.dyt

Est_Prov.dyt

Desde el Dyane: <emos seleccionado el Anlisis de 4e&resin M>ltiple: donde nos saldr una ventana como #sta.

%ulsaremos el botn I"alcularJ: y nos saldrn los resultados como los ;ue pasaremos a analiBar

A N L I S I S D E R E = R E S I N M R L T I P L E =========================================================== IDENTIFICACIN DE LAS VARIABLES ------------------------------VARIABLE DEPENDIENTE: 9 Pa!' - 9 Pa!' *P.'6; $% $%!%&S'

VARIABLES INDEPENDIENTES: 1; 9Va!P'6+ - Va!"a&",) P'6+a&",) 11-12 798 2; N"H%+E&' - N"H%+ E&'),-"&' 3; C4' aM%! - C4' a $% M%!&a$' Ma !"# $% &'%("&"%) %* $% &'!!%+a&",) *"-.+%: -------------------------------------------9 Pa!' -------1/0000 -0/0164 -0/6125 0/0717 9Va!P'6+ --------0/0164 1/0000 -0/0361 0/1621 N"H%+E&' C4' aM%! -------- --------0/6125 0/0717 -0/0361 0/1621 1/0000 0/1136 0/1136 1/0000

9 Pa!' 9Va!P'6+ N"H%+E&' C4' aM%!

Estos son los valores )ue m!s nos interesan de esta parte

Coeficie te de deter!i "ci# $ 0,%&'(. Coeficie te de corre)"ci# !*)ti+)e$ 0,6%(5 C'%("&"%) % $% !%5!%*",) a+(a: 6/4077

C6*:%2%*)$* +* +*$*(!%)'2%4) nos interesa en &ran medida: ya ;ue es el porcenta(e de la varianBa eCplicada por este modelo. 5tro aspecto important.simo: a la <ora de estudiar nuestro modelo: es saber si ;ueremos incluir o no las variables independientes.
COEFIC; PROPORC; S<MA DE

DESVIACIN C<ADRADOS VARIAN:A VARIABLE MEDIA ESTNDAR ATADIDA -------- -------------- --------------------------------- -------9 Pa!' 3/1000 1/1071 9Va!P'6+ 1/2300 4/2177 0/0164 0/0003 N"H%+E&' 23/0676 0/3764 5/1200 1/4012 2365/4341

COEFICIENTE RE=RESIN

ERROR ESTNDAR

T DE ST<DENT

CORREL; PARCIAL ATADIDA

----------- ---------- -------- -------0/0200 -0/5167 0/0001 0/0214 0/0100 0/0001 -0/6223 -0/1001 .=0/4125 -5/7435 -0/6462 .=0/0000 1/2152 .=0/0643 -------------2 0/2612

C4' aM%! 1113/1200 2/7621 0/0452 ------ -------5/2521 0/4211

ANLISIS DE LA VARIAN:A ----------------------F<ENTE DE VARIACIN ---------------------D%6"$a a +a !%5!%*",): R%*"$4': Va!"a)#a ' a+: =RADOS LIBERTAD --------------3 46 ----41 S<MA C<ADRADOS --------------------25/2521 35/4271 --------------------61/2200 MEDIA C<ADRADOS --------------------2/6174 0/7702

F $% S)%$%&'! &') 3 @ 46 5!a$'* $% +"6%! a$ = 11/1221

7.= 0/00008

'l nivel de ) de -pE1.1111/.

nedecor no parece mostrar nin&>n problema

/. . Caso &r(ctico

con !>ANE.

"abe destacar la posibilidad de mane(ar variables cate&ricas en el anlisis de re&resin m>ltiple. i tuvi#ramos variables cate&ricas: podr.amos convertirlas en variables m#tricas y traba(ar con estas nuevas variables en el anlisis de re&resin m>ltiple. 6eamos con otra 8D como <acer esto9

C'[%ocum ents and (ettings[eG=::?[Escritorio[9afa[C7M1798.%K8

Co!+ort.,yt

'n la si&uiente 88DD las variables ;ue adoptan valores ! o 0 son variables cate&ricas: por e(emplo la variable *: ;ue toma los si&uientes valores9 !.A i 0.A 3o 7a variable 5 tiene varias cate&or.as. %ara convertir las variables cate&ricas en variables m#tricas: tendremos ;ue crear variables ficticias -en el men> Datos del Dyane/. 6emoslo &rficamente9

A<ora crearemos otra variable ficticia con la variable "lase <acemos el anlisis con las variables ficticias creadas.

ocial: y

"on todo ello: las variables ficticias ;ue nos <a creado son9
A N L I S I S D E R E = R E S I N M R L T I P L E ===========================================================

IDENTIFICACIN DE LAS VARIABLES ------------------------------VARIABLE DEPENDIENTE: FICTIE01 - <*a a!G% a $% &!>$" ': SJ 71 = SJU 0 = N'8

VARIABLES INDEPENDIENTES: 1; FICTIE01 - C+a*% *'&"a+: A+ aP-%$"a a+ a 71 = SJU 0 = N'8 2; FICTIE02 - C+a*% *'&"a+: M%$"a -%$"a 71 = SJU 0 = N'8 3; FICTIE03 - C+a*% *'&"a+: M%$"a 6aGa 71 = SJU 0 = N'8

Ma !"# $% &'%("&"%) %* $% &'!!%+a&",) *"-.+%: -------------------------------------------FICTIE01 -------1/0000 0/2216 0/1512 -0/2634 FICTIE01 -------0/2216 1/0000 -0/2122 -0/3267 FICTIE02 -------0/1512 -0/2122 1/0000 -0/5210 FICTIE03 --------0/2634 -0/3267 -0/5210 1/0000 0/1534

FICTIE01 FICTIE01 FICTIE02 FICTIE03

C'%("&"%) % $% $% %!-")a&",):

i observamos el "oeficiente de "orrelacin: notamos ;ue el modelo slo nos esta eCplicando un !5 S. 's un porcenta(e muy ba(o: por lo ;ue lle&aremos a la conclusin de ;ue no podemos usar slo esta variable: variable ;ue <emos separado en varias ficticias para convertirla en una variable m#trica.

C'%("&"%) % $% &'!!%+a&",) -F+ ".+%: 0/3117 C'%("&"%) % $% !%5!%*",) a+(a: 0/0215 COEFIC; PROPORC; DESVIACIN C<ADRADOS VARIAN:A VARIABLE MEDIA ESTNDAR ATADIDA -------- -------------- --------------------------------- -------FICTIE01 0/2530 0/4347 FICTIE01 0/1610 0/3675 15/2473 0/0231 FICTIE02 12/3477 0/0653 FICTIE03 0/7147 0/0042 ------ -------2/1217 0/1534 0/3020 0/4320 0/4617 0/4161 COEFICIENTE RE=RESIN ERROR ESTNDAR T DE ST<DENT CORREL; PARCIAL ATADIDA S<MA DE

----------- ---------- -------- ------0/5121 0/3356 0/1012 0/0522 0/0474 0/0452 1/1314 .=0/0000 7/0776 .=0/0000 2/2242 .=0/0261 0/3004 0/2122 0/0703 -------------2

i establecemos un nivel de si&nificacin del 1.15: podemos aceptar todas las variables independientes: ya ;ue la t de tudent es menor para todas las variables.

ANLISIS DE LA VARIAN:A ----------------------F<ENTE DE VARIACIN ---------------------D%6"$a a +a !%5!%*",): R%*"$4': Va!"a)#a ' a+: =RADOS LIBERTAD --------------3 116 ----111 S<MA C<ADRADOS --------------------22/1217 160/0013 --------------------122/1110 MEDIA C<ADRADOS --------------------1/6632 0/1606

- de S edecor co

. y ((6 /r"dos de )i0ert"d 1 60,'5.'

2+1 0,00003

7a f de nedecor es otro indicador ;ue <ay ;ue mirar tambi#n. 's un indicador importante.

/.#. E9&ortar de !%ane a S0SS.

A<ora trataremos de pasar una 88DD de Dyane a % : ya ;ue el anlisis de re&resin m>ltiple del Dyane es bastante simple: siendo muc<.simo ms completo el anlisis del % . %ara ello seleccionamos continuacin9 el elemento de men> ;ue vemos a

%ulsando Aceptar: nos saldr otra ventana: donde &uardamos como fic<ero de datos: es decir .dat9

A<ora ya podemos entrar en % : y desde el podremos traba(ar con esta base de datos S0SS: A!rir la OO%% de formato texto.

Men> Arc<ivoNDatos:

Abrimos la base de datos ;ue acabamos de crear para el %

2 pasamos por las si&uientes ventanas9

V"uidadoW 'ste parmetro <ay ;ue cambiarlo

A<ora ;uitaremos la opcin "oma y la opcin 'spacio9

Mna veB <emos <ec<o la transformacin podemos dar nombre a las variables: tal y como ;ueramos: seleccionando la pestaa I6ista de variablesJ9

Mna veB <ec<o esto: <acemos el anlisis de re&resin. %ara nuestro e(emplo ;ueremos estimar la variable paro en funcin de otras tres: como son varipob: niveleco y cotamer9

'l resultado se muestra a continuacin.

Re6resin
b Variables introd $idas7eliminadas

Modelo $

Caria2les introducidas C<?TAMER@ CARIP?>@ a NICELEC?

Caria2les eliminadas 4

MHtodo Introducir

a4 Todas las varia2les solicitadas introducidas 24 Caria2le dependiente0 PAR?

Res men del modelo Modelo $ R R cuadrado @*', a @+## R cuadrado corregida @()+ Error tJp4 de la estimacin @)&&'%

a4 Caria2les predictoras0 -Constante.@ C<?TAMER@ CARIP?>@ NICELEC?

A;u. se eCplican los .ndices ms importantes. R 2"'+('+6 es el coeficiente de determinacin. %odemos ver ;ue los resultados son los mismos ;ue el Dyane. 5bservamos ;ue nuestro modelo eCplica un 40S del total.

4 cuadrado corre&ida: deber.a ser muy parecida a 4 cuadrado. 'n nuestro caso vemos ;ue es una comparacin muy sub(etiva.

b ANOVA

Modelo $

Regresin Residual Total

Suma de cuadrados #'@)'# ('@+#) *$@#),

gl ( +* +%

Media cuadrtica )@*$& @&&,

5 $$@$)%

Sig4 @,,, a

a4 Caria2les predictoras0 -Constante.@ C<?TAMER@ CARIP?>@ NICELEC? 24 Caria2le dependiente0 PAR?

'n el Anlisis de 6arianBas tenemos una ) de el Dyane obtuvimos un valor muy parecido.

nedecor de !!.!,9. 'n

a Coe,i$ientes

Modelo $

-Constante. CARIP?> NICELEC? C<?TAMER

Coe!icientes no estandari=ados > Error tJp4 *@+,) @+&) /@,#, @,#% /@'$& @,%, @,,, @,,,

Coe!icientes estandari=ad os >eta /@,&) /@*') @##,

t $(@+$( /@*)# /'@&++ $@)%*

Sig4 @,,, @+%% @,,, @,*+

a4 Caria2le dependiente0 PAR?

A;u. metemos todas las variables independientes y vemos las consecuencias. Tenemos diferentes valores de t para cada variable: con distintas si&nificaciones.

S0SS: Estimaci-n por etapas. A<ora si&uiente m#todo seria la re&resin lineal con el M5$6+6 +* P'161 S"2*1%&61. 'ste m#todo es muy >til cuando el n>mero de variables independientes es muy elevado. =asta a<ora: con el Dyane y con % : <emos metido slo $ variables independientes. 3ormalmente: sern ms. i tenemos variables independientes elevado: es me(or usar esta se&unda opcin para saber si incluimos o eliminamos cada variable independiente9

'l resultado se muestra a continuacin.

Re6resin
a Variables introd $idas7eliminadas

Modelo $

Caria2les introducidas

Caria2les eliminadas

NICELEC?

MHtodo Por pasos -criterio0 Pro24 de 5 para entrar 6: @,',@ Pro24 de 5 para salir 7: @$,,.4

a4 Caria2le dependiente0 PAR?

olo se <a seleccionado la variable nivel econmico

Res men del modelo Modelo $ R R cuadrado @*$( a @(&' R cuadrado corregida @(*# Error tJp4 de la estimacin @)%($(

a4 Caria2les predictoras0 -Constante.@ NICELEC?


b ANOVA

Modelo $

Regresin Residual Total

Suma de cuadrados ##@%%$ ()@#)% *$@#),

gl $ +) +%

Media cuadrtica ##@%%$ @&%)

5 #)@)##

Sig4 @,,, a

a4 Caria2les predictoras0 -Constante.@ NICELEC? 24 Caria2le dependiente0 PAR?

A<ora el nivel de f de nedecor es totalmente distinto: siendo si&nificativo.

a Coe,i$ientes

Modelo $

-Constante. NICELEC?

Coe!icientes no estandari=ados > Error tJp4 *@(%$ @+)$ /@+)$ @,%,

Coe!icientes estandari=ad os >eta /@*$(

t $(@#)% /'@(*%

Sig4 @,,, @,,,

a4 Caria2le dependiente0 PAR?


b Variables e1$l idas

Modelo $

>eta dentro CARIP?> /@,(% a C<?TAMER @#,* a

t /@(() $@)$(

Sig4 @&(& @,&*

Correlacin parcial /@,+% @#'*

EstadJsticos de colinealidad Tolerancia @%%% @%*(

a4 Caria2les predictoras en el modelo0 -Constante.@ NICELEC? 24 Caria2le dependiente0 PAR?

An(lisis de Su&uestos de la RM. "oeficiente estandariBado es importante para interpretar los datos. "uando metemos las variables independientes en unidades distintas: el coeficiente de re&resin beta: no son directamente comparables. %or eso: lo ms >til es el coeficiente estandariBado. 7o veremos con el % .
'raba-o con 5P55

i tenemos valores perdidos en % podremos utiliBar la funcin de % de I4eemplaBar valores perdidosJ. 's importante reemplaBar estos valores con la media o con el valor estimado de re&resin. %ara realiBar la re&resin m>ltiple tenemos ;ue cumplir varios supuestos9 upuestos &enerales 7inealidad.A %ara esto podr.amos visualiBar &rficamente &rficos de dispersin.. 3ormalidad.A A;u. tenemos dos opciones. ' %odemos eCaminar <isto&rama. Mediante el % podemos eCaminar el =isto&rama de residuos ' %odemos eCaminar &rficos de dispersin. 'n este caso eCaminamos variables =omocedasticidad.A Tendremos ;ue aplicar el A)>#%1%1 0'1'+6 *) $ +* S$"+*)$. Msamos el valor t de tudent para estandariBar los residuos -lue&o lo estudiamos/ Ausencia de errores correlacionados.A Dos opciones9 ' Msar el Anlisis anterior basado en t de tudent ' Msar el test de DurbanAXatson

E9a*inar Nor*alidad

%ara eCaminar la normalidad9

'studiaremos las si&uientes tres variables9

A<ora seleccionamos estad.sticos: seleccionando solo descriptivos

Tambi#n en la parte Prficos: muy importante seleccionar IPrficos con pruebas de 3ormalidadJ

3os salen una serie de datos: pero lo ;ue realmente nos interesara en el &rfico YAY normal de varpobl9

r!ico K/K normal de varpo2l


(

Normal esperado

/$

/#

/( /$, , $, #,

Calor o2servado

e puede ver ;ue la variable si&ue una distribucin normal

r!ico K/K normal de nivel economico


#

Normal esperado

/$

/# $ # ( + ' * & ) %

Calor o2servado

e puede ver ;ue la variable si&ue una distribucin normal

r!ico K/K normal de cuotamer


( #

Normal esperado

/$

/# /( /+,,, /#,,, , #,,, +,,, *,,, ),,, $,,,, $#,,, $+,,,

Calor o2servado

e puede ver ;ue la variable tiene una no tiene una distribucin eCactamente normal: pero las tres variables concurren en una distribucin normal. %ara ver la linealidad se puede comprobar mediante IPenerar todos los &rficos parcialesJ en % -I4e&resin 7inealJ JPrficosJ eleccionar esta opcin/

E9a*inar Linealidad

Mna veB analiBado el supuesto de normalidad: nos lanBaremos a <acer la 4e&resin 7ineal. 7o ;ue ;ueremos es predecir el paro en funcin de unas variables independientes -varpobl: nivel econmico y cuota mercado/. %ara ello seleccionamos la variable paro como >nica variable dependiente: y varias variables independientes -varpobl: niveleco y cuotamer/. M#todo E Introducir: ;ue ;uiere decir ;ue vamos a aplicar la 'stimacin "on(unta 'n el botn 'stad.sticos: seleccionaremos9 Dia&nsticos de colinealidad.A 3os saldr el .ndice 6I) y el valor de la tolerancia. DurbinAXatson.A 'n la parte de 4esiduos. %ara ver 2a ;ue nuestro inter#s es ver los supuestos &enerales y espec.ficos 'n el botn IPrficosJ: eleccionaremos para podremos ver la <omocedasticidad.

d4' ID si&nifica residuo tipificado d%4'D si&nifica re&resin valor tipificado pronosticado eleccionamos =isto&rama para ver normalidad de los residuos: y &eneramos todos los &rficos parciales para ver linealidad

Re6resin
b Variables introd $idas7eliminadas

Modelo $

Caria2les introducidas cuotamer@ varpo2l@ nivel a economico

Caria2les eliminadas 4

MHtodo Introducir

a4 Todas las varia2les solicitadas introducidas 24 Caria2le dependiente0 paro


b Res men del modelo

Modelo $

R R cuadrado @*', a @+##

R cuadrado corregida @()+

Error tJp4 de la estimacin @)&&'%

Dur2in/L atson $@)%'

a4 Caria2les predictoras0 -Constante.@ cuotamer@ varpo2l@ nivel economico 24 Caria2le dependiente0 paro

'l Test DurbinAXatson no lo <emos tenido <asta a<ora: para ver la ausencia de errores correlacionados. "omo re&la &eneral: este .ndice tiene ;ue ser alrededor de 0. i obtenemos el n>mero cerca de 0 podremos interpretar la variable independiente como ;ue no tienen errores correlacionados. -6er la parte de &rficos/
b ANOVA

Modelo $

Regresin Residual Total

Suma de cuadrados #'@)'# ('@+#) *$@#),

gl ( +* +%

Media cuadrtica )@*$& @&&,

5 $$@$)%

Sig4 @,,,a

a4 Caria2les predictoras0 -Constante.@ cuotamer@ varpo2l@ nivel economico 24 Caria2le dependiente0 paro
a Coe,i$ientes

Modelo $

-Constante. varpo2l nivel economico cuotamer

Coe!icientes no estandari=ados > Error tJp4 *@+,) @+&) /@,#, @,#% /@'$& @,%, @,,, @,,,

Coe!icientes estandari=ad os >eta /@,&) /@*') @##,

t $(@+$( /@*)# /'@&++ $@)%*

Sig4 @,,, @+%% @,,, @,*+

EstadJsticos de colinealidad Tolerancia 5IC @%** @%') @%(# $@,(' $@,++ $@,&+

a4 Caria2le dependiente0 paro

Mna re&la &eneral es ;ue 6I) tiene ;ue ser menor ;ue 0. 'l valor de tolerancia reducido denota elevada colinealidad. "uando tenemos un valor de tolerancia 1.0 o 1.$ denota elevada colinealidad.

'l valor del 6I) es el inverso del valor de tolerancia. i 6I) es elevado: si&nifica elevada colinealidad. i ambos valores estn cerca de !: podemos decir ;ue no eCiste la multicolinealidad. i el valor de tolerancia es muy ba(o y el del 6I) es muy alto: lo ;ue tenemos es problema de multicolinealidad. 'Cisten correlaciones muy altas entre las variables independientes. 7o ;ue podemos <acer es un Anlisis de "omponentes %rincipales y utiliBar los factores ;ue resulten como variables independientes para realiBar el anlisis de re&resin. "oeficientes -de beta/ no estandariBados y "oeficientes -de beta/ estandariBados. 7os coeficientes no estandariBados no son comparables directamente. in embar&o: para comparar la importancia de las variables: tenemos el "oeficiente 'standariBado: para ver ;ue variable es mas importante.
a Dia6nsti$os de $olinealidad

Modelo $

Dimensin $ # ( +

Autovalor #@&*' @&*( @+(& @,(+

Indice de condicin $@,,, $@%,( #@'$' )@%*+

Proporciones de la varian=a nivel -Constante. varpo2l economico @,$ @,+ @,$ @,, @%( @,$ @,# @,# @,# @%& @,$ @%&

cuotamer @,' @,, @%+ @,$

a4 Caria2le dependiente0 paro


a Estad4sti$os sobre los resid os

Calor pronosticado Residuo 2ruto Calor pronosticado tip4 Residuo tip4

MJnimo #@($(, /$@*$(( /#@$)' /$@)()

MAimo '@'*&# #@+($) #@#%' #@&&$

Media (@%,,, @,,,, @,,, @,,,

Desviacin tJp4 @&#*(* @)',($ $@,,, @%*%

N ', ', ', ',

a4 Caria2le dependiente0 paro

&r5,i$os

Fistograma Caria2le dependiente0 paro


$,

5recuencia

# ,

Desv4 tJp4 : @%& Media : ,@,, N : ',@,,


&' #@', #@#' #@,, #@&' $@', $@#' $@,, $@' @&, @'' @#,, ,@ ' /@#, /@'' /@&@,, /$@#' /$@', /$@&' /$

Regresin Residuo tipi!icado

"on este &rfico vemos la normalidad de los residuos. A;u. <ay al&unos valores fuera de la normalidad: pero supon&amos ;ue estn dentro del l.mite y cumplen el supuesto de la normalidad: y aceptamos la normalidad.
r!ico de dispersin Caria2le dependiente0 paro
(

Regresin Residuo tipi!icado

/$

/# /( /# /$ , $ # (

Regresin Calor pronosticado tipi!icado

'l &rfico de la dispersin es el resultado de los valores estandariBados y los valores basados en t de tudent. %ara cumplir el supuesto de <omocedasticidad observaremos esta dispersin. "uando observamos este &rfico tenemos ;ue tener una dispersin ")%:6(!* 8 '#*'$6(%' -debe cumplir las dos condiciones/. 'n nuestro &rfico vemos ;ue es bastante uniforme -por;ue cuando estn los puntos AP4M%AD5 en los dos eCtremos del &rafico tenemos <eterocedasticidad/

r!ico de regresin parcial Caria2le dependiente0 paro


(

/$

paro

/# /$, , $, #,

varpo2l

'ste vale para ver ;ue tipo de relacin eCiste entre dos variables: en el % <acemos doble clic sobre este &rfico. A;u. podremos seleccionar9

5pciones del diseo de dispersin9

2 aceptamos
r!ico de regresin parcial Caria2le dependiente0 paro
(

/$

paro

/# /$, , $, #,

varpo2l

7a l.nea es linealidad
r!ico de regresin parcial Caria2le dependiente0 paro
( # $ , /$ /#

paro

/( /+ /( /# /$ , $ # ( +

nivel economico

A;u. vemos ;ue tienen una relacin lineal


r!ico de regresin parcial Caria2le dependiente0 paro
( #

/$

paro

/# /+,,, /#,,, , #,,, +,,, *,,, ),,, $,,,, $#,,,

cuotamer

r!ico de regresin parcial Caria2le dependiente0 paro


( #

/$

paro

/# /+,,, /#,,, , #,,, +,,, *,,, ),,, $,,,, $#,,,

cuotamer

%uede ;ue a;u. tambi#n eCista una relacin lineal. 3o es ;ue sea muy claro: pero por eso <ay ;ue tener una buena base terica: para poder (ustificar la inclusin de esta variable.

E3ercicio , 0. LC-mo determinar&a incluir o rechazar varia!les independientes utilizadas en una ecuaci-n de regresi-n m ltipleM 3. L1or qu es importante examinar el supuesto de linealidad cuando se utiliza la regresi-nM 3. Explique y relacione los siguientes trminos' error de predicci-n y error est"ndar. ?. 6nterprete el siguiente ta!la' Naria!le C0 C3 C4 C? C: 8olerancia ;,GG3 ;,F;? ;,0F= ;,GG; ;,003 N6> 0,;;= 0,:F= :,44= 0,;0; F,FGB

:. Explique la relaci-n entre el coeficiente de determinaci-n y el coeficiente de determinaci-n ajustado.

1. IC*o deter*inar5a incluir o rec4a8ar +aria'les inde&endientes utili8adas en una ecuacin de re1resin *=lti&leK I%or una parte: con el test t de student mediamos la si&nificacin de la correlacin parcial de las variables independientes. 2 la eCpresar.amos mediante el valor del coeficiente del coeficiente t de student. %or otra parte: apoyndonos en una base terica fi(ar.amos el nivel de si&nificacin eCi&ida y con ello determinar.amos si una variable debe salir de la ecuacin o mantenerse.J <intaro. 7a palabra clave es C6((*#'2%4) P'(2%'#. =ay ;ue buscar la correlacin parcial ;ue tiene si&nificacin

. I0or Ju. es i*&ortante e9a*inar el su&uesto de linealidad cuando se utili8a la re1resinK

7a re&resin M>ltiple busca una combinacin: mediante el coeficiente de correlacin -;ue esta basado en una relacin linealR el concepto de correlacin es el de la combinacin entre dos variables/. I%or;ue el concepto fundamental del anlisis de re&resin ;ue es el coeficiente de correlacin esta basado en una relacin linealJ. <intaro. 3. E9&liJue % relacione los si1uientes t.r*inos: Error de &rediccin % error est(ndar. 'n la re&resin m>ltiple buscamos una combinacin lineal. %or eso buscamos variables independientes ;ue eCpli;uen la variable independiente. 8uscamos una l.nea recta. 7a diferencia entre el valor real y valor predic<o es el error de prediccin. 3uestra misin es minimiBar todos los errores de prediccin. I'l error de prediccin es la diferencia entre los valores reales y el valor de prediccin de la variable dependiente 2: mientras ;ue el error estndar es la desviacin t.pica de los errores de prediccin. Mn error estndar mas pe;ueo implica una prediccin mas se&ura.J <intaro. ). Inter&rete el si1uiente ta'la: Naria!le C0 C3 C4 C? C: 8olerancia ;,GG3 ;,F;? ;,0F= ;,GG; ;,003 N6> 0,;;= 0,:F= :,44= 0,;0; F,FGB

1C&mo podemos interpretar el valor de la tolerancia y el valor del *,2314u indican los 5ndices tolerancia y *,23 Ausencia de multicolinealidad" 6od5amos observar la matriz de correlaciones( pero es bastante sub7etivo" 6or eso usamos estos dos 5ndices" El *,2 es la inversa de la tolerancia" I7os valores de tolerancia superan todos el valor 1.,1 indicando niveles de colinealidad muy reducidos. De la misma manera: los valores del 6I) de dic<as variables estn muy prCimos a !.1. in embar&o: las dos variables restantes: es decir F$ y F5: dic<os .ndices indican lo contrario9 altos niveles de multicolinealidad. i no eliminamos las observaciones altamente correlacionadas la interpretacin de los coeficientes de correlacin podr.an verse afectados ne&ativamente por la multicolinealidad.J <intaro.

,. E9&liJue la relacin entre el coe"iciente de deter*inacin % el coe"iciente de deter*inacin a3ustado. %ara determinar el coeficiente de determinacin tenemos ;ue conse&uir el coeficiente de correlacin m>ltiple -4/. %ara saber el S de la varianBa eCplicada por el modelo: <ay ;ue subir al cuadrado: y nos da el coeficiente de determinacin. 'l coeficiente de determinacin esta afectado por el numero de variables independientes relativas al tamao muestral -relacionada con variables independientes y tamao muestral/. %or tanto tenemos ;ue corre&ir esta infraccin. 'l valor corre&ido es el "oeficiente de determinacin a(ustado. I'l coeficiente de determinacin -4 / es el coeficiente de correlacin m>ltiple al cuadrado. "omo dic<o coeficiente esta afectado por el n>mero de variables independientes relativas al tamao muestral: es necesario Icorre&irJ la inflacin de la 40. Dic<a correccin da lu&ar al 0 coeficiente de determinacin a(ustado "DA. 'l "DA -4 a(ustado/ se <ace mas pe;ueo a medida ;ue tenemos menos observaciones por variable independiente: y por ello es particularmente >til para comparar las diferentes ecuaciones de re&resin estimadas con distintas variables independientes o diferentes tamaos muestrales.J <intaro.
0

TEMA -: EL ANQLSIS !ISCRIMINANTE

Estructura de la clase: 1. Introduccin. . !e"inicin % o'3eti+o. #. T.r*inos % conce&tos '(sicos del A!. ). Su&uestos del A!. ,. !ise$o del A!. -. Casos &r(cticos con !>ANE. Introduccin. 'l AD consiste en predecir a ;ue 3("96 pertenece un determinado individuo. %or re&la &eneral: 2 E F! G F0 G F$ G ... G Fn donde 2 es la variable dependiente y Fn son las variables independientes. 'n el AD: las variables dependientes independientes son !5$(%2'1. son 2'$*34(%2'1 y las

Yueremos encontrar la l.nea de corte ;ue separe o diferencie los dos &rupos. "ada dispersin est asociada a las variables F! y F0. %odemos comprobar ;ue ambas dispersiones no estn separadas del todo ya ;ue tienen un solapamiento: es decir: una Bona en com>n. %ara ello: en el AD tenemos ;ue calcular un valor terico D: ;ue es una :")2%4) combinacin lineal de las dos variables F! y F0: ;ue separe o diferencie claramente cada &rupo. 'n el e(e D situamos las dos distribuciones y los puntos medios de cada distribucin proyectados cortan las nubes de puntos en direccin a su e(e y coinciden con los puntos medios de cada nube de puntos. Debido a esto >ltimo: es por lo ;ue a estos puntos situados en D se les llama 2*)$(6%+*1.

"omo se comprobar ms adelante: para distin&uir o discriminar dos &rupos estad.sticamente: tenemos ;ue calcular sus respectivos valores tericos -por e(emplo medias/ y aplicar un test para saber si estos valores son si&nificativamente diferentes. 'videntemente si lo son: podemos separar ambas distribuciones para poder as. identificar a ;ue &rupo pertenece un individuo cual;uiera. !e"inicin % o'3eti+o. El A% es una tcnica multivariante de predicci-n que se emplea cuando la varia!le dependiente no es mtrica y las varia!les independientes son mtricas. 'l AD es el caso contrario al MA356A donde 2 ! G 20 G ... G 2n E F! . 7as variables 2 tienen ;ue ser !5$(%2'1 y la F 2'$*34(%2'. *os o!jetivos de esta tcnica son' a$ determinar si existen diferencias estad&sticamente significativas entre los perfiles de dos #o m"s$ grupos. !$ determinar cu"l de las varia!les independientes cuantifica mejor dichas diferencias. c$ esta!lecer el n mero y la composici-n de las dimensiones de la discriminaci-n entre los grupos.

Conce&tos % t.r*inos '(sicos del A!. 0$ <uncin discri*inante: -)D/ El A% clasifica dos #o m"s$ grupos mediante una funci-n discriminante, que es una com!inaci-n lineal de dos #o m"s$ varia!les. Esta funci-n es la que separa los grupos. *a com!inaci-n lineal es de la siguiente forma ] P a A X0C0A X3C3 A ..... A XnCn
#

a es cte./

"ada punto del e(e D: representa una puntuacin d Discriminante. H: &untuacin H discri*inante on el con(unto de valores ;ue nos van a servir para discriminar los &rupos. De estas puntuaciones nos interesa saber el centroide o media de la distribucin para lue&o comprobar si eCisten diferencias si&nificativas entre ambas medias. 3$ An(lisis de correlaciones cannicas 6!>ANE2: analiza la relaci-n entre m ltiple varia!les dependientes y m ltiple varia!les independientes. 'n D2A3' se utiliBa este test estad.stico para calcular la )D y analiBa la correlacin entre m>ltiples variables tanto dependientes como independientes.

MM2 IM%54TA3T'9 Tanto D2A3' como % nos proporcionan el mismo n>mero de &rupos pero los resultados de los test son distintos. 31 Coe"icientes estandari8ados de las "unciones discri*inantes cannicas 6S0SS2: (uando se ignora el signo! cada coeficiente representa la contribucin relativa de su variable asociada a esa funcin. on los pesos de la )D: es decir: son los X!: X0: ...: Xn
5uncin $ M$ M# M( M* M& M$' M$* M$& M$) 4,,+ 4+(* /4,#' 4()# 4**' 4,$& 4'&, 4$#$ 4#&) # 4$)( /4')) /4('# 4$,+ 4#** 4+%& /4$&% /4#(+ 4*&&

'1 Cargas discriminantes 75P558$ 4as cargas discriminantes 0tambin denominadas correlaciones de estructura1 miden la correlacin lineal simple entre cada variable independiente " la funcin discriminante. on anlo&as a las car&as del A"%. "on esta matriB obtenemos las variables asociadas a cada )D -estn marcadas por T/.
Matri0 de estr $t ra
5uncin $ M# M$* M( M* M$ M& M$& M$) M$' 4'#&-N. 4+*#-N. 4+('-N. 4+#*-N. 4(+)-N. 4(+&-N. 4#,#-N. 4((+ 4((' # /4+', /4#,) /4+,% /4$,* /4##( 4#*+ 4$,& 4'+#-N. 4(%$-N.

:$ Matri8 de con"usin 6!>ANE % S0SS2: es una ta!la de do!le entrada en la que en las filas se indica la pertenencia real al grupo correspondiente, y en las columnas, la estimada por el A%. G("96 1 G("96 R*'# 1 1 G("96 R*'# 1 G("96 2 1 13 G("96 3 1 0 T6$'# 19 14

2 G("96 R*'# 0 3 T6$'# 18

0 14

15 16

15

'n D2A3' obtenemos el porcenta(e de asi&naciones acertadas de la si&uiente forma9


-!+ + !$+ !5/ N R#7/,B -!9 + !4 + !5/

B$ Re&resentacin 1r("ica *ediante un *a&a territorial 6S0SS2:

funciones discriminantes cannicas


' 3 2 3 1 ? :1 2

countr"
(entroides de grupo 3

3uncin 2

:2 :3 :' :2 ? 2 '

2 1

3uncin 1

Su&uestos del A!. Su&uestos 1enerales: : 5ormalidad : *inealidad. %ara comprobar la linealidad en % : nos situamos es Prficos AH Dispersin AH Dispersin simple definiendo en el e(e 2 -var. Dependiente/ y en el e(e F -var. Independiente/. Su&uestos es&ec5"icos: : 6gualdad de dispersi-n #M de Oox$. %ara comprobar el supuesto de i&ualdad de las matrices de covarianBas con dispersin uniforme. =a de ser H 1:15 -no si&nificativo/. Atencin9 es muy sensible respecto a otros factores como la normalidad de las variables y el tamao muestral. -Debido a esto: <asta 1:1$ es aceptable/. : Ausencia de la multicolinealidad. 'n % se utiliBa el m#todo de inclusin por etapas -o pasos/. "on este m#todo obtenemos una medida del 6I). %ara ausencia de multicolinealidad el valor del 6I) debe ser menor de 0. !ise$o del A!. %eterminar o!jetivos. =ay ;ue eCpresar los ob(etivos claramente. 's al&o muy breve (eleccionar varia!les dependientes e independientes. Tendremos ;ue entender los tipo de variables y escalas usados en la encuesta %eterminar el tama.o muestral. Tendremos ;ue tener al menos 01 observaciones por cada variable independiente. Examinar los supuestos. Tanto &enerales como espec.ficos Estimar las funciones discriminantes. MtiliBamos pro&ramas informticos %eterminar la influencia glo!al de las funciones discriminantes 02utovalores " 4ambda de NilOs en ;P;;1. Msando una serie de .ndices obtenidos por pro&ramas informticos: ver si tiene sentido usar esas funciones discriminantes. Determinar el nivel de precisin predictiva de las funciones discriminantes 0/atri+ de confusin1. Tenemos ;ue preparar la matriB de confusin para saber si estamos clasificando los datos correctamente. 6eremos como calcular porcenta(e de clasificacin. 6nterpretar los resultados mediante una representaci-n gr"fica. 'ste mapa se llama Mapa territorial. Nalidar los resultados. Mn m#todo de validacin mas popular es dividir la muestra en dos &rupos: i&ual ;ue en los analiBas de interdependencia.

Casos &r(cticos
Casos 0r(cticos con !>ANE

Muy importante saber ;ue los datos del Dyane y % es distinta. 7a salida del Dyane es muy limitada: y % muestra demasiada informacin. Debemos seleccionar ;ue tipo de datos incluiremos en el traba(o.

7a investi&acin fue <ec<a por el creador del Dyane para ver actitudes <acia la empresa y los sistemas econmicos de los estudiantes. =an estudiado 4 &eneraciones de estudiantes de empresariales. Yueremos ver si eCisten diferencias si&nificativas. 6ariable dependiente.A Tipo de %romocin independiente.A 'l resto de variables 6ariable

Tenemos la salida del Dyane

A N L I S I S D I S C R I M I N A N T E M R L T I P L E ============================================================= IDENTIFICACIN DE LAS VARIABLES ------------------------------=R<POS 7VAR;CRITERIO8: =R<PO 1; PROMOCEA: T%!&%!a 721P228 =R<PO 2; PROMOCEA: C4a! a 722P238 =R<PO 3; PROMOCEA: Q4") a 723P248 =R<PO 4; PROMOCEA: S%K a 724P258 VARIABLES PREDICTORAS: 1; EP<EOBEC; La %-.!%*a .F6+"&a .4%$% &4-.+"! +'* '6G% "H'* %&'),-"&'* -%G'! I4% +a .!"Ha$a; 2; EP<EOBSO; La %-.!%*a .F6+"&a .4%$% &4-.+"! +'* '6G% "H'* *'&"a+%* -%G'! I4% +a .!"Ha$a 3; DIREES<F; La $"!%&&",) $% +a %-.!%*a $%6% *%! %+%5"$a .'! *4(!a5"' 4)"H%!*a+/ .'! '$'* +'* !a6aGa$'!%* $% +a %-.!%*a; 4; ECMEEPLA; La %&')'-Ja $% -%!&a$' .!'.'!&"')a 4)a a*"5)a&",) $% !%&4!*'* -%G'! I4% +a '6 %)"$a &') +a %&')'-Ja .+a)"("&a$a .'! %+ %* a$'; 5; DESPELIB; La .'*"6"+"$a$ $% $%*."$' +"6!%/ &') ")$%-)"#a&",)/ .%!-" "!Ja +a &!%a&",) $% .4%* '* $% !a6aG'; 6; LIBERAL; E+ +"6%!a+"*-' %* +a -%G'! $'& !")a %&'),-"&a; 7; ECSOLMER; La %&')'-Ja *'&"a+ $% -%!&a$' %* +a -%G'! $'& !")a %&'),-"&a; 2; SOCIALIS; E+ *'&"a+"*-' %* +a -%G'! $'& !")a %&'),-"&a; 1; COM<NISM; E+ &'-4)"*-' %* +a -%G'! $'& !")a %&'),-"&a; 10; EMPRECRE; E+ %-.!%*a!"' $%6% *%! a$-"!a$' .'! +a *'&"%$a$ .'!I4% &!%a !"I4%#a; 11; EMPREEXP; E+ %-.!%*a!"' *,+' %K.+' a a +'* !a6aGa$'!%*; 12; BENEOB31; E+ 6%)%("&"' $%6%! *%! %+ .!"-%! '6G% "H' $% +a %-.!%*a 13; BENSOLAC; E) +a $"* !"64&",) $% +'* 6%)%("&"'* $%6%) .a! "&".a! *,+' +'* a&&"')"* a*; 14; BALESOCI; T'$a* +a* %-.!%*a* $%6%!Ja) !%a+"#a! %+ 6a+a)&% *'&"a+; 15; MARLENEC; E+ -a!M% ")5 %* *,+' 4) -> '$' .a!a H%)$%! -N*/ &!%a)$' )%&%*"$a$%* a.a!%) %*;

A;u. tenemos la tabla de medias para cada variable independiente por cada &rupo.
-----------------------------------------------------------------------------VARIABLE MEDIAS MEDIAS MEDIAS MEDIAS MEDIAS PREDICTOR =R<PO 1 =R<PO 2 =R<PO 3 =R<PO 4 TOTALES ------------ ------------ ------------ ------------ ------------ -----------1;EP<EOBEC 2/2414 2/2333 2/2623 2/0323 2/1667 2;EP<EOBSO 4/1034 3/2333 3/1756 3/5323 3/2025 3;DIREES<F 1/1655 2/2000 2/1220 2/1613 2/1235 4;ECMEEPLA 3/5262 3/6667 4/0000 4/0162 3/1012 5;DESPELIB 2/6207 2/3333 2/1756 3/0424 2/2210 6;LIBERAL 2/3713 2/7667 2/7205 3/1774 2/2520 7;ECSOLMER 3/6207 3/4000 3/3102 3/3327 3/4136 2;SOCIALIS 2/6552 2/6667 2/6221 2/3710 2/5556 1;COM<NISM 1/4423 1/5333 1/5610 1/6774 1/5202 10;EMPRECRE 2/2061 3/2667 2/7561 3/1135 2/1112

11;EMPREEXP 2/1034 1/2333 1/7317 1/7521 1/2272 12;BENEOB31 2/2166 2/5667 3/3651 2/6210 2/2511 13;BENSOLAC 2/1371 2/0000 2/2623 2/0424 2/1111 14;BALESOCI 4/3103 4/4667 4/1151 4/2017 4/2716 15;MARLENEC 2/7526 2/2333 2/0732 2/0161 2/2037 ------------------------------------------------------------------------------

Mna de las caracter.sticas del Dyane es ;ue utiliBa el sistema de correlaciones cannicas: y aparece el anlisis. e&>n <intaro: una mayor limitacin del Dyane: es ;ue no indica ;ue variable tiene si&nificacin estad.stica. olo mirando la salida del Dyane no podemos decir ;ue variable tiene si&nificacin estad.stica. Tenemos $ funciones discriminantes: cada una corresponde a una columna. 'stos coeficientes corresponden a X! X0: etc. on los coeficientes de una combinacin lineal. 'ntonces si tiene mayor coeficiente variable si&nifica ;ue tiene mayor contribucin a la capacidad discriminante. 7a variable cannica ! eCplica casi el 5* S de la varianBa total. 7a cannica 0 eCplica casi el $1S de la varianBa. %ero el Dyane no ofrece mas datos: no dice ;ue variable tiene si&nificacin estad.stica nos ofrece representacin &rafica.
CORRELACIONES CANNICAS: -----------------------VARIABLE CANNICA 1 ---------C'%("&"%) % $% &'!!%+a&",): 0/2750 9 Ha!"a)#a %K.+"&a$a: 56/13019 C'%("&"%) %* Ha!"a6+%*: Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; 1 2 3 4 5 6 7 2 1 10 11 12 13 14 15 EP<EOBEC EP<EOBSO DIREES<F ECMEEPLA DESPELIB LIBERAL ECSOLMER SOCIALIS COM<NISM EMPRECRE EMPREEXP BENEOB31 BENSOLAC BALESOCI MARLENEC 0/0361 0/3761 -0/2426 -0/0531 -0/0101 -0/3023 0/0734 0/0316 -0/3023 -0/6462 -0/0243 0/3146 0/1213 0/0302 0/1722 0/1425 -0/0407 0/1514 0/4271 0/3126 0/1624 -0/1411 0/1321 0/1342 -0/4162 -0/0242 0/5146 0/1063 -0/1111 -0/4771 0/2216 0/1321 0/2162 0/0225 -0/4273 -0/1121 -0/1172 0/4113 -0/2710 0/4712 -0/2304 0/2131 0/2172 0/1261 -0/3701 VARIABLE CANNICA 2 ---------0/1430 21/61319 VARIABLE CANNICA 3 ---------0/0650 13/45629

"orrelaciones variables es ms dif.cil de interpretar.

C'!!%+a&",) Ha!"a6+%*: Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; Va!; 1 2 3 4 5 6 7 2 1 10 11 12 13 14 15 EP<EOBEC EP<EOBSO DIREES<F ECMEEPLA DESPELIB LIBERAL ECSOLMER SOCIALIS COM<NISM EMPRECRE EMPREEXP BENEOB31 BENSOLAC BALESOCI MARLENEC 0/2034 0/1575 -0/2421 -0/6202 -0/2153 -0/1221 0/2576 0/7767 -0/2250 -0/1424 0/6724 0/6536 0/6657 0/0707 0/7611 -0/0270 -0/0123 0/0663 0/7722 0/2612 0/3537 -0/4122 -0/1415 0/4206 -0/0426 -0/6062 0/6146 0/7224 -0/1032 -0/5617 0/5211 0/2712 0/5243 -0/1322 -0/4125 -0/1164 -0/2125 0/6111 -0/1115 0/3134 -0/4242 0/3006 0/1271 0/4221 -0/3021

7os centros de &ravedad: eCpresan los centroides de cada &rupo. on centroides eCpresados en puntuaciones d discriminante. %ero es muy dif.cil interpretar mirando simplemente estas cifras. 's muy dif.cil ver la relacin entre los 4 centroides. in embar&o % ofrece representacin &rfica: facilitando la interpretacin.
C%) !'* $% 5!aH%$a$: =!4.' =!4.' =!4.' =!4.' 1 2 3 4 0/2475 -0/2146 0/3540 -0/5266 -0/3122 -0/5710 0/4133 0/0164 -0/2215 0/3563 0/2272 -0/1272

'n la matriB de confusin tenemos la asi&nacin se&>n funciones discriminantes: es decir: clasificacin predic<a se&>n el A D. A la iB;. tenemos &rupos reales. 'l &rupo ! esta con !+ miembros: el &rupo 0 con !$ y &rupo $ con !5 y el 4 con 0+. in embar&o vemos ;ue <ay miembros mal clasificados9 'n &rupo !9 !+ miembros bien clasificados 'n &rupo 0 <ay $ mal clasificados: etc@
Ma !"# $% &')(4*",) &a+&4+a$a &') a&"%! '*8 '$a* +a* (4)&"')%* $"*&!"-")a) %* 7-a@'! )F-%!' $%

=R<POS REALES ------------1 2 3 4 TOTAL

ASI=NACION SE=<N F<NCIONES DISCRIMINANTES ---------------------------------------------=R<PO =R<PO =R<PO =R<PO 1 2 3 4 TOTAL ---------------------17 3 7 2 21 7 13 3 7 30 2 6 20 7 41 5 15 15 27 62 ---------------------37 37 45 43 162

%or tanto nuestra conclusin final es el porcenta(e de la calcificacin correcta: ;ue es 4+.5$S.

Mn 4+.5$S de los encuestados estn correctamente clasificados. @C4!6 1* 2'#2"#' *1$* )=!*(6B %ara ello: tenemos ;ue sumar las cifras en dia&onal -!+ G !$ G 01 G 0+/ Despu#s dividimos el n>mero total de &rupos reales9 -!+ G !$ G 01 G 0+/ AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA E 1.4+5$ -09 G $1 G 4! G *0/
PORCENTA3E DE ASI=NACIONES ACERTADAS POR LAS F<NCIONES DISCRIMINANTES: 47/539

'l autor del Dyane recomienda <acer un anlisis de la varianBa -A356A/ para ver ;ue variables son relevantes: ya ;ue el Dyane no ofrece este anlisis en el AD. "uando ;ueremos averi&uar si eCisten diferencias si&nificativas entre dos medias usamos el test t de tudent. 'ntonces: el A de la varianBa es para ver si eCiste diferencias si&nificativas entre $ o mas medias. 'n nuestro caso <ablamos de 4 &rupos. "uando tenemos ;ue comparar 4 medias y saber si son estad.sticamente distintas: tendremos ;ue utiliBar el Anlisis de la varianBa o A356A

'n el Dyane podemos usar este anlisis fcilmente. %ara ello9

6ariable Dependiente.A '%M]58'" 6ariable Tratamiento.A Tipo de &rupos

ANLISIS DE LA VARIAN:A 7<)"$"!%&&"')a+8 ======================================== VARIABLE DEPENDIENTE: La %-.!%*a .F6+"&a .4%$% &4-.+"! +'* '6G% "H'* %&'),-"&'* -%G'! I4% +a .!"Ha$a; 7EP<EOBEC8 VARIABLE TRATAMIENTO: P!'-'&",) 7&4!*'8 7PROMOCEA8

T' a+ =!4.'* Ha!"a6+% !a a-"%) ' --------------T%!&%!a 721P228 C4a! a 722P238 Q4") a 723P248 S%K a 724P258

NF-%!' $% &a*'* -------162

M%$"a --------------2/1667

D%*H"a&",) %* N)$a! --------------0/1112

S4-a $% &4a$!a$'* --------------134/5000

21 30 41 62

2/2414 2/2333 2/2623 2/0323

1/0053 0/2225 0/1377 0/2412 S4-a ;;;;;

21/3103 23/3667 36/0422 43/1355 --------------132/6613 MEDIA C<ADRADOS --------------0/6121 0/2316

F<ENTE DE VARIACIN --------------------E) !% +'* 5!4.'*: D%) !' $% +'* 5!4.'*: T' a+:

=RADOS LIBERTAD --------------3 152 ----161

S<MA C<ADRADOS --------------1/2327 132/6613 -----------134/5000

P!'.'!&",) $% Ha!"a)#a %K.+"&a$a .'! +'*

!a a-"%) '* RV = 0/0137 7.= 0/53568

F $% S)%$%&'! &') 3 @ 152 5!a$'* $% +"6%! a$ = 0/7300

De a;u. nos interesa esto. ale ;ue no eCisten diferencias si&nificativas: por tanto las 4 medias son estad.sticamente i&uales 'ntonces a<ora seleccionamos la 0e variable y variable tratamiento la misma de antes9

ANLISIS DE LA VARIAN:A 7<)"$"!%&&"')a+8 ======================================== VARIABLE DEPENDIENTE: La %-.!%*a .F6+"&a .4%$% &4-.+"! +'* '6G% "H'* *'&"a+%* -%G'! I4% +a .!"Ha$a 7EP<EOBSO8 VARIABLE TRATAMIENTO: P!'-'&",) 7&4!*'8 7PROMOCEA8 NF-%!' $% &a*'* -------162 M%$"a --------------3/2025 D%*H"a&",) %* N)$a! --------------0/1542 S4-a $% &4a$!a$'* --------------147/6710

T' a+ =!4.'* Ha!"a6+% !a a-"%) '

--------------T%!&%!a 721P228 C4a! a 722P238 Q4") a 723P248 S%K a 724P258

21 30 41 62

4/1034 3/2333 3/1756 3/5323

0/6615 1/1571 0/6044 1/0734 S4-a ;;;;;

12/6217 40/1667 14/1756 71/4355 --------------131/2674 MEDIA C<ADRADOS --------------2/2031 0/2214

F<ENTE DE VARIACIN --------------------E) !% +'* 5!4.'*: D%) !' $% +'* 5!4.'*: T' a+:

=RADOS LIBERTAD --------------3 152 ----161

S<MA C<ADRADOS --------------2/4116 131/2674 -----------147/6710

P!'.'!&",) $% Ha!"a)#a %K.+"&a$a .'! +'*

!a a-"%) '* RV = 0/0570 7.= 0/02568

F $% S)%$%&'! &') 3 @ 152 5!a$'* $% +"6%! a$ = 3/1210

A<ora si son si&nificativas para esta variable. 'l Autor recomienda ;ue se <a&a este anlisis de la varianBa para cada variable independiente. 7a me(or recomendacin es realiBar MA356A: ;ue lue&o miraremos. Mna veB ;ue sepamos las variables independientes tienen diferencias si&nificativas: las seleccionamos y realiBamos el A D9

7as medias de las variables seleccionadas son estad.sticamente distintas.

A N L I S I S D I S C R I M I N A N T E M R L T I P L E ============================================================= IDENTIFICACIN DE LAS VARIABLES ------------------------------=R<POS 7VAR;CRITERIO8: =R<PO 1; PROMOCEA: T%!&%!a 721P228 =R<PO 2; PROMOCEA: C4a! a 722P238 =R<PO 3; PROMOCEA: Q4") a 723P248 =R<PO 4; PROMOCEA: S%K a 724P258 VARIABLES PREDICTORAS: 1; EP<EOBSO; La %-.!%*a .F6+"&a .4%$% &4-.+"! +'* '6G% "H'* *'&"a+%* -%G'! I4% +a .!"Ha$a

2; 3; 4; 5;

LIBERAL; E+ +"6%!a+"*-' %* +a -%G'! $'& !")a %&'),-"&a; EMPRECRE; E+ %-.!%*a!"' $%6% *%! a$-"!a$' .'! +a *'&"%$a$ .'!I4% &!%a !"I4%#a; BENEOB31; E+ 6%)%("&"' $%6%! *%! %+ .!"-%! '6G% "H' $% +a %-.!%*a MARLENEC; E+ -a!M% ")5 %* *,+' 4) -> '$' .a!a H%)$%! -N*/ &!%a)$' )%&%*"$a$%* a.a!%) %*;

7a !e variable -'%M]58 5/ esta contestada con escala de liOert. Tenemos 4 medias9 Prupo !.A 4.!1$4 Prupo 0.A $.,$$ Prupo $.A $.9+5* Prupo 4.A $.5$0$ @. @C6!6 96+*!61 1'0*( <"* #'1 4 !*+%'1 16) +%1$%)$'1B Tendremos ;ue realiBar el Anlisis de la varianBa: para ver si eCisten diferencias si&nificativas entre las 4 medias. 7o ;ue nos interesara de ese anlisis es el nivel de si&nificacin p.
-----------------------------------------------------------------------------VARIABLE MEDIAS MEDIAS MEDIAS MEDIAS MEDIAS PREDICTOR =R<PO 1 =R<PO 2 =R<PO 3 =R<PO 4 TOTALES ------------ ------------ ------------ ------------ ------------ -----------1;EP<EOBSO 4/1034 3/2333 3/1756 3/5323 3/2025 2;LIBERAL 2/3713 2/7667 2/7205 3/1774 2/2520 3;EMPRECRE 2/2061 3/2667 2/7561 3/1135 2/1112 4;BENEOB31 2/2166 2/5667 3/3651 2/6210 2/2511 5;MARLENEC 2/7526 2/2333 2/0732 2/0161 2/2037 ------------------------------------------------------------------------------

A<ora la funcin discriminante ! eCplica el *9S de la varianBa. 7a variable cannica 0 eCplica el 0$S. 7a funcin ! eCplica la mayor parte de la varianBa. Tiene ms capacidad discriminatoria.

CORRELACIONES CANNICAS: -----------------------VARIABLE CANNICA 1 ---------C'%("&"%) % $% &'!!%+a&",): 0/2241 9 Ha!"a)#a %K.+"&a$a: 61/14549 VARIABLE CANNICA 2 ---------0/0750 23/06419 VARIABLE CANNICA 3 ---------0/0253 7/71059

C'%("&"%) %* Ha!"a6+%*: Va!; Va!; Va!; Va!; Va!; 1 2 3 4 5 EP<EOBSO LIBERAL EMPRECRE BENEOB31 MARLENEC 0/3326 -0/3377 -0/5270 0/5720 0/1747 0/0036 -0/3433 0/2123 -0/6770 0/6140 -0/4242 0/6341 -0/2015 -0/0712 0/2220

C'!!%+a&",) Ha!"a6+%*:

Va!; Va!; Va!; Va!; Va!;

1 2 3 4 5

EP<EOBSO LIBERAL EMPRECRE BENEOB31 MARLENEC

0/1464 -0/2212 -0/1445 0/7231 0/7064

0/1211 -0/4037 -0/1257 -0/6712 0/6132

-0/2112 0/2121 -0/3036 -0/1255 0/1431

C%) !'* $% 5!aH%$a$: =!4.' =!4.' =!4.' =!4.' 1 2 3 4 0/7162 -0/2552 0/3253 -0/4663 0/3400 0/2114 -0/3262 -0/0442 0/1321 -0/2747 -0/0262 0/1253

6eamos la matriB de confusin. "on esta matriB podemos decir ;ue !4 personas del &rupo ! estn bien clasificadas !$ personas del &rupo 0 estn bien clasificadas @ "alculamos el porcenta(e de clasificacin. A<ora <emos ba(amos: lo cual es bastante il&ico: ya ;ue deber.amos <aber me(orado y no <a sido as.. =emos eliminado variables: pero 7a intencin del autor es ;ue en veB de meter todas las variables: <ay ;ue meter las variables ;ue tienen medias distintas estad.sticamente: para realiBar un anlisis estad.stico ms eficaB. "on el Dyane no se puede ofrecer ms informacin.

Ma !"# $% &')(4*",) &a+&4+a$a &') a&"%! '*8

'$a* +a* (4)&"')%* $"*&!"-")a) %* 7-a@'! )F-%!' $%

=R<POS REALES ------------1 2 3 4 TOTAL

ASI=NACION SE=<N F<NCIONES DISCRIMINANTES ---------------------------------------------=R<PO =R<PO =R<PO =R<PO 1 2 3 4 TOTAL ---------------------14 3 6 6 21 4 13 6 7 30 6 2 22 5 41 2 14 16 24 62 ---------------------32 32 50 42 162

PORCENTA3E DE ASI=NACIONES ACERTADAS POR LAS F<NCIONES DISCRIMINANTES: 45/069

Casos &r(cticos con S0SS: Esti*acin Si*ult(nea.

4ealicemos el mismo Anlisis con el % % tiene 0 posibilidades9

: desde una perspectiva &lobal.

!/ 'stimacin imultnea -"on(unta/ 0/ 'stimacin por 'tapas.A 'l pro&rama realiBa los datos paso a paso para seleccionar las variables independientes ;ue tienen si&nificacin estad.stica. i seleccionamos esta opcin: la salida solo incluir.a las variables independientes ;ue fueran estad.sticamente si&nificativas en las funciones discriminantes. %or eso sabr.amos ;ue variable independiente tendr.amos ;ue incluir. 'n la estimacin simultanea no lo sabr.amos -el Dyane lo <ace con estimacin simultanea y nos inventamos un m#todo para verlo/. 'n % podemos realiBar el A de la varianBa para todas las variables independientes ;ue seleccionemos. Msaremos las mismas variables ;ue en el Dyane9

Tendremos ;ue definir el ran&o: as. definimos de ! a 4

A<ora seleccionamos !5 variables independientes: por e(emplo las primeras !59

eleccionamos estad.sticos: sin seleccionar demasiados para no liarnos9 A356A M de 8oC.A %ara ver la dispersin uniforme en la matriB de covarianBas

A<ora seleccionamos el tipo de clasificacin

De momento no &uardaremos nada

Dis$riminante

Res men del /ro$esamiento /ara el an5lisis de $asos Casos no ponderados Clidos EAcluidos Cdigos de grupo perdidos o !uera de rango Perdida al menos una varia2le discriminante Perdidos o !uera de rango am2os@ el cdigo de grupo G al menos una de las varia2les discriminantes4 Total eAcluidos Casos Totales N $*# , , Porcenta9e $,,@, @, @,

@,

, $*#

@, $,,@,

%r ebas de i6 aldad de las medias de los 6r /os Lam2da de Lil3s @%)* @%+( @%%* @%') @%'( @%#( @%%, @%&% @%)% @%,$ @%&) @%(# @%)% @%)# @%(, 5 @&(, (@$)$ @#(+ #@(#) #@'%' +@(&$ @'(+ $@$'* @'*, '@&&$ $@#,( (@)'& @'*# @%%$ (@%(+ gl$ ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( gl# $') $') $') $') $') $') $') $') $') $') $') $') $') $') $') Sig4 @'(* @,#* @)&( @,&& @,'+ @,,' @**, @(#% @*+# @,,$ @($$ @,$$ @*+$ @(%% @,$,

EP<O?>EC EP<O?>S? DIREOS<5 ECMEOPLA DESPOLI> LI>ERAL ECS?LMER S?CIALIS C?M<NISM EMPROCRE EMPROE;P >ENO?>P$ >ENS?LAC >ALOS?CI MAREONEC

'l valor terico ): puede usarse i&ual para el anlisis de la varianBa. Tenemos el nivel de si&nificacin: entonces podremos saber ;ue variable tiene si&nificacin estad.stica: ;ue variable debemos incluir. %ara ello incluiremos a;uellas ;ue ten&an un nivel de si&nificacin menor de 1.15. 'n nuestro caso sern9 '%M]58 5 7I8'4A7 @A i nos fi(amos: son las mismas ;ue las ;ue seleccionamos en Dyane. As. en lu&ar de realiBar !5 anlisis de la varianBa como en el Dyane: podremos saber ;ue variables tienen si&nificacin estad.stica.

An5lisis ( %r eba de Bo1 sobre la i6 aldad de las matri$es de $o8arian0a


Lo6aritmo de los determinantes PR?M?COA $ # ( + Intra/grupos com2inada Rango $' $' $' $' $' Logaritmo del determinante /%@,)& /'@,,( /*@*%$ /(@'++ /#@(')

Los rangos G logaritmos naturales de los determinantes impresos son los de las matrices de covarian=a de los grupos4 Res ltados de la /r eba M de >oA 5 AproA4 gl$ gl# Sig4 '$,@)$( $@$+& (*, (#$,+@))( @,#%

Contrasta la 8iptesis nula de Mue las matrices de covarian=a po2lacionales son iguales4

3os fi(aremos en el nivel de si&nificacin de test M de 8oC. Tenemos 1.109. =a salido si&nificativo: pero en clase se eCplico ;ue el eCamen M de 8oC es muy sensible respecto a la normalidad de variables y al tamao muestral. 'ntonces <asta 1.1$ es aceptable. %or tanto: ms o menos aceptamos este nivel de si&nificacin.

Res men de las , n$iones $anni$as dis$riminantes


E1$' *1 #' %):6(!'2%4) !>1 %!96($')$*. A;u. podemos saber ;ue funcin discriminante tenemos ;ue considerar. Tal y como <icimos en el anlisis de componentes principales: a;u. tambi#n se utiliBa el concepto de autovalor -4ecordatorio de Autovalor.A /. 7a funcin ! tiene mayor nivel de autovalor. 7a funcin 0 y $: es menor. 7a funcin ! eCplica un *! S 7a funcin 0 eCplica un 0+ S 7a funcin $ eCplica un !! S ?%ero ;ue funciona discriminante es estad.sticamente si&nificativoU %ara saber esto tendremos ;ue <acer un eCamen estad.stico de 7ambda de XilOs. 's el eCamen estad.stico mas importante en el A D.

)uncin ! tiene un nivel de si&nificacin E 1.11! )uncin 0 tiene un nivel de si&nificacin E 1.0!* )uncin $ tiene un nivel de si&nificacin E 1.*+9 olo la funcin discriminante ! tiene nivel de si&nificacin estad.stica suficientemente alto. %or eso: slo consideraremos la funcin discriminante !
A to8alores 5uncin $ # ( Autovalor I de varian=a @(&%a *$@* @$*&a #&@$ a @,&, $$@( I acumulado *$@* ))@& $,,@, Correlacin cannica @'#+ @(&) @#''

a4 Se 8an empleado las ( primeras !unciones discriminantes cannicas en el anlisis4


Lambda de 9il:s Contraste de las !unciones $ a la ( # a la ( ( Lam2da de Lil3s @')$ @),$ @%(' C8i/cuadrado )#@#&* ((@'*+ $,@$)$ gl +' #) $( Sig4 @,,$ @#$* @*&%

's muy importante saber interpretar estas dos tablas. %odemos decir ;ue la funcin ! eCplica la mayor parte de la varianBa: pero mirando los autovalores no sabemos ;ue funcin discriminante tiene si&nificacin estad.stica: para eso tenemos ;ue usar la lambda de XilOs. 'sto se utiliBa tambi#n para MA356A. Tenemos $ niveles de si&nificacin. 7a )on discrim.nate ! tiene si&nificacin estad.stica suficientemente alta: por eso consideraremos solo la funcin discriminante !.

Coe,i$ientes estandari0ados de las , n$iones dis$riminantes $anni$as 5uncin # @$'( /@,+( @$&# @+'# @+#, @$*% /@$*$ @$+) @$++ /@',% /@,%, @'(& @$$+ /@#,' /@+%)

EP<O?>EC EP<O?>S? DIREOS<5 ECMEOPLA DESPOLI> LI>ERAL ECS?LMER S?CIALIS C?M<NISM EMPROCRE EMPROE;P >ENO?>P$ >ENS?LAC >ALOS?CI MAREONEC

$ /@,+# /@+#% @#%$ @,*$ @,$# @(+) /@,)* /@,(& @(*, @&#$ @,%) /@++& /@$+# /@,(' /@#,#

( @##) @$(% @##+ @,#% /@+%# /@$%# /@#,( @+#% /@#&% @+*( /@#(* @#%( @##+ @$#% /@(*%

on coeficientes estandariBados: por tanto son anlo&os a los coeficientes de re&resin beta estandariBados. %or tanto el mayor valor indica el mayor peso. abemos ;ue variables independiente tenemos ;ue considerar para el anlisis. Tenemos 5 con medias estad.sticamente si&nificativas. 7a 0e informacin obtenida de la prueba de i&ualdad entre &rupos es ;ue tenemos ;ue incluir en la funcin ! como variable independiente la '%M]58 5: lue&o 7I8'4A7: 'M%4]"4': 8'3]58Z! y MA4L]3'" %ara interpretar la funcin ! tenemos ;ue tener en cuenta el si&no de coeficientes estandariBados.

Matri0 de estr $t ra 5uncin # /@,(% @#+% /@,'% @$,* /@$,( @+*)N @+*,N @(%&N /@(&*N /@(,(N @$)(N /@,'+ /@,#' /@##+ @,$$

EMPROCRE LI>ERAL EP<O?>S? C?M<NISM ECS?LMER DESPOLI> >ENO?>P$ ECMEOPLA MAREONEC >ALOS?CI >ENS?LAC S?CIALIS EP<O?>EC EMPROE;P DIREOS<5

$ @'$,N @+(+N /@()#N @$+)N /@$+,N @$,* /@#)& @#$# /@(+# /@,$* /@$$# /@$)& /@$'+ /@$*' @,%#

( @(%( /@$#& @#'( /@,&) /@$$+ /@(+& @(,% /@$$, /@($+ @##, @,&( @(++N @#*(N /@#++N @$((N

Correlaciones intra/grupo com2inadas entre las varia2les discriminantes G las !unciones discriminantes cannicas tipi!icadas Caria2les ordenadas por el tamaQo de la correlacin con la !uncin4 N4 MaGor correlacin a2soluta entre cada varia2le G cualMuier !uncin discriminante4

Tambi#n se puede ver lo anterior en la matriB de estructura. Tenemos la matriB de car&as: ;ue son anlo&as a las car&as del Anlisis de "omponentes %rincipales: eCpresan pesos.
F n$iones en los $entroides de los 6r /os 5uncin # /@((+ /@*,% @'#* @$,(

PR?M?COA $ # ( +

$ /@%)( @#+% /@+$$ @*$$

( /@#%* @(*+ @#(# /@$%$

5unciones discriminantes cannicas no tipi!icadas evaluadas en las medias de los grupos

=emos obtenido datos parecidos con el Dyane. %ero podemos interpretar estos n>meros observando el si&no de cada n>mero. "ada promocin tiene centroide distinto. %ero es ms fcil verlo en la representacin &rfica: como el Mapa territorial

Estad4sti$os de $lasi,i$a$in
Res men del /ro$eso de $lasi,i$a$in Procesados EAcluidos $*# , , $*# Cdigo de grupo perdido o !uera de rango Perdida al menos una varia2le discriminante <sados en los resultados

%robabilidades /re8ias /ara los 6r /os Casos utili=ados en el anlisis No ponderados Ponderados #% #%@,,, (, (,@,,, +$ +$@,,, *# *#@,,, $*# $*#@,,,

PR?M?COA $ # ( + Total

Previas @#', @#', @#', @#', $@,,,

Mapa territorial (Asumiendo que todas las funciones excepto las dos primeras son = 0) Discriminante cannica Funcin 2 -3,0 -2,0 -1,0 ,0 1,0 2,0 3,0 3,0 34 34 34 34 34 34 2,0 34 34 3 34 1333 34 11133 34 11333 34 1,0 11133 34 11333 34 11133 34 11333 * 34 11133 34 11333 34 * ,0 11133 34 1133332444 * 1122 222444 12 222444 12 * 2224444 12 2222444 -1,0 12 222444 12 2224444 12 2222444 12 222444 12 2224 12 2 -2,0 12 12 12 12 12 12 -3,0 12 -3,0 -2,0 -1,0 ,0 1,0 2,0 3,0 Funcin discriminante cannica 1

Smbolos usados en el mapa territorial Smbol -----1 2 3 4 Grupo ----1 2 3 4 Etiqu --------------------

I)$"&a 4) &%) !'"$% $% 5!4.'

!unciones discriminantes cannicas


(

( $

+ #

PR?M?COA
Centroides de grupo +0 SeAto (0 Kuinto

/$

5uncin #

/# #0 Cuarto /( /+ /( /# /$ , $ # ( + $0 Tercero

5uncin $

'stamos mirando centroides !: 0: $ y 4. Desde el punto de vista de la funcin discriminante !: los &rupos mas discriminados son los &rupos ! y 4. A<ora: depende de las pre&untas: tenemos ;ue interpretar la interrelacin entre cada &rupo
a Res ltados de la $lasi,i$a$in

?riginal

Recuento

PR?M?COA $ # ( + $ # ( +

rupo de pertenencia pronosticado $ # ( + $& ( & # ) $# ( & ) ' #$ & ' $( $* #) ')@* $,@( #+@$ *@% #*@& +,@, $,@, #(@( $%@' $#@# '$@# $&@$ )@$ #$@, #'@) +'@#

Total #% (, +$ *# $,,@, $,,@, $,,@, $,,@,

a4 Clasi!icados correctamente el +)@$I de los casos agrupados originales4

Casos &r(cticos con S0SS: Esti*acin &or Eta&as.

A<ora veremos el m#todo de inclusin por etapas

Dis$riminante
Res men del /ro$esamiento /ara el an5lisis de $asos Casos no ponderados Clidos EAcluidos Cdigos de grupo perdidos o !uera de rango Perdida al menos una varia2le discriminante Perdidos o !uera de rango am2os@ el cdigo de grupo G al menos una de las varia2les discriminantes4 Total eAcluidos Casos Totales N $*# , , Porcenta9e $,,@, @, @,

@,

, $*#

@, $,,@,

%r ebas de i6 aldad de las medias de los 6r /os Lam2da de Lil3s @%)* @%+( @%%* @%') @%'( @%#( @%%, @%&% @%)% @%,$ @%&) @%(# @%)% @%)# @%(, 5 @&(, (@$)$ @#(+ #@(#) #@'%' +@(&$ @'(+ $@$'* @'*, '@&&$ $@#,( (@)'& @'*# @%%$ (@%(+ gl$ ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( gl# $') $') $') $') $') $') $') $') $') $') $') $') $') $') $') Sig4 @'(* @,#* @)&( @,&& @,'+ @,,' @**, @(#% @*+# @,,$ @($$ @,$$ @*+$ @(%% @,$,

EP<O?>EC EP<O?>S? DIREOS<5 ECMEOPLA DESPOLI> LI>ERAL ECS?LMER S?CIALIS C?M<NISM EMPROCRE EMPROE;P >ENO?>P$ >ENS?LAC >ALOS?CI MAREONEC

An5lisis ( %r eba de Bo1 sobre la i6 aldad de las matri$es de $o8arian0a

Lo6aritmo de los determinantes PR?M?COA $ # ( + Intra/grupos com2inada Rango # # # # # Logaritmo del determinante @$$) @&%, @'*) @+*& @'*)

Los rangos G logaritmos naturales de los determinantes impresos son los de las matrices de covarian=a de los grupos4 Res ltados de la /r eba M de >oA 5 AproA4 gl$ gl# Sig4 $#@#%& $@((# % $$'+%)@# @#$+

Contrasta la 8iptesis nula de Mue las matrices de covarian=a po2lacionales son iguales4

Tiene nivel de si&nificacin distinto ;ue antes. e&>n el m#todo nos saldr un resultado u otro. A;u. nos <a salido no si&nificativo: por lo ;ue no tenemos problema sobre la i&ualdad de las matrices de covarianBas.

Estad4sti$os /or /asos


a;b;$;d Variables introd $idas7eliminadas

Lam2da de Lil3s Paso $ # Introducidas EMPROCRE >ENO?>P$ EstadJstico @%,$ @),# gl$ $ # gl# ( ( gl( $')@,,, $')@,,, EstadJstico '@&&$ *@$,% 5 eAacta gl$ gl# ( $')@,,, * ($+@,,,

Sig

En cada paso se introduce la varia2le Mue minimi=a la lam2da de Lil3s glo2al4 a4 El n"mero mAimo de pasos es (,4 24 La 5 parcial mJnima para entrar es (4)+4 c4 La 5 parcial mAima para eliminar es #4&$ d4 El nivel de 5@ la tolerancia o el CIN son insu!icientes para continuar los clculos4

'l concepto bsico de la estimacin por etapas es meter una variable independiente: si sale si&n: metemos otra variable y as. continuamente: metiendo y sacando variables: para ;uedarnos con a;uellas ;ue tienen si&nificacin estad.stica.

Variables en el an5lisis Paso $ # Tolerancia $@,,, @)%+ @)%+ 5 para eliminar '@&&$ )@+&& *@+)* Lam2da de Lil3s @%(# @%,$

EMPROCRE EMPROCRE >ENO?>P$

Aparece el nivel de Tolerancia. A;u. no tiene nin&>n problema: ya ;ue esta prCimo a !.

Variables no in$l idas en el an5lisis Paso , Tolerancia $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, @%), @%%% @)+' @%,+ @%$' @%,' @%)* @%)& @%&$ @%(% @)%+ @%#* $@,,, @%&* @%&( @%%% @)$# @%,+ @%$( @)%) @%*% @%&& @%&, @%(% @%$, @%%+ @%&( Tolerancia mJn4 $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, $@,,, @%), @%%% @)+' @%,+ @%$' @%,' @%)* @%)& @%&$ @%(% @)%+ @%#* $@,,, @%&* @))+ @)%( @&%) @)$% @)($ @)(, @)&) @)&& @)*) @)+* @)', @))% @)&, 5 para introducir @&(, (@$)$ @#(+ #@(#) #@'%' +@(&$ @'(+ $@$'* @'*, '@&&$ $@#,( (@)'& @'*# @%%$ (@%(+ @'$) #@&)# #@$(' $@%,$ (@,'' #@+)' @)%% @%$( $@$#, @*#, *@+)* $@'&* @%)$ #@),$ @*&' #@'$% $@+$, $@)(% #@),% #@&+$ @&,+ @&(* $@$'' @'%* @&%% @)*+ #@&*' Lam2da de Lil3s @%)* @%+( @%%* @%') @%'( @%#( @%%, @%&% @%)% @%,$ @%&) @%(# @%)% @%)# @%(, @)%# @)'* @)** @)&, @)'# @)*, @))* @))* @))# @)%$ @),# @)&' @))' @)'' @&%# @&*' @&)$ @&&+ @&*$ @&*# @&%$ @&%$ @&)+ @&%( @&%, @&)% @&*$

EP<O?>EC EP<O?>S? DIREOS<5 ECMEOPLA DESPOLI> LI>ERAL ECS?LMER S?CIALIS C?M<NISM EMPROCRE EMPROE;P >ENO?>P$ >ENS?LAC >ALOS?CI MAREONEC EP<O?>EC EP<O?>S? DIREOS<5 ECMEOPLA DESPOLI> LI>ERAL ECS?LMER S?CIALIS C?M<NISM EMPROE;P >ENO?>P$ >ENS?LAC >ALOS?CI MAREONEC EP<O?>EC EP<O?>S? DIREOS<5 ECMEOPLA DESPOLI> LI>ERAL ECS?LMER S?CIALIS C?M<NISM EMPROE;P >ENS?LAC >ALOS?CI MAREONEC

Lambda de 9il:s 5 eAacta gl$ gl# ( $')@,,, * ($+@,,,

Paso $ #

N"mero de varia2les $ #

Lam2da @%,$ @),#

gl$ $ #

gl# ( (

gl( $') $')

EstadJstico '@&&$ *@$,%

Sig4 @,, @,,

Res men de las , n$iones $anni$as dis$riminantes


A to8alores 5uncin $ # Autovalor I de varian=a @#$#a )&@% a @,#% $#@$ I acumulado )&@% $,,@, Correlacin cannica @+$) @$*)

a4 Se 8an empleado las # primeras !unciones discriminantes cannicas en el anlisis4

7a informacin ms importante del AD: aparece a partir de esta tabla. A;u. <emos detectado 0 funciones con nivel de si&nificacin estad.stica aceptable: pero la funcin ! eCplica el ,, S de a varianBa -casi toda/. 7a funcin 0 eCplica solo el !0S. %ar seleccionar las funciones discriminantes con nivel de si&nificacin estad.stica aceptable realiBamos el eCamen de 7ambda de XilOs. 7a funcin ! es estad.sticamente si&nificativa: mientras ;ue la 0 no lo es. %or tanto en el anlisis posterior se considerara solo la funcin ! -notar ;ue <emos obtenido el mismo resultado ;ue en el primer anlisis: pero la diferencia aparece en las tablas posteriores/
Lambda de 9il:s Contraste de las !unciones $ a la # # Lam2da de Lil3s @),# @%&# C8i/cuadrado (+@))) +@'(+ gl * # Sig4 @,,, @$,+

Coe,i$ientes estandari0ados de las , n$iones dis$riminantes $anni$as 5uncin EMPROCRE >ENO?>P$ $ @%#$ /@&%$ # @'#, @&,#

=emos incluido dos variables independientes: ya ;ue estad.sticamente <ablando: en la estimacin por etapas se usa un eCamen mas sofisticado. e calcula el nivel de 7ambda de XilOs para cada paso de la estimacin y seleccionando >nicamente las variables independientes ;ue tienen si&nificacin aceptable para la 7ambda de XilOs.

A<ora lo ;ue <aremos es: eCcepto esos resultados: interpretar 0 variables independientes en la funcin discriminatoria !. %or eso: no <ace falta interpretar la se&unda parte: ya ;ue la funcin 0 no es si&nificativa 7a primera variable tiene si&no G: y la se&unda A. 7os encuestados <an mostrados percepciones opuestas.

Matri0 de estr $t ra 5uncin $ /@$',N /@$+'N /@$(+N @,*#N /@,#%N /@+%$ @**+ /@$#& @$+$ @,)) @$*( @$%* /@$'% /@,## /@,($

a S?CIALIS a MAREONEC a C?M<NISM a >ALOS?CI a EP<O?>S? >ENO?>P$ EMPROCRE DIREOS<5a a LI>ERAL a >ENS?LAC a DESPOLI> a ECMEOPLA a EMPROE;P a ECS?LMER a EP<O?>EC

# /@,$) /@,&) /@$,% /@,+& /@,$# @)&$N @&+)N /@+$+N @#)&N @#)&N @#+'N @#+,N /@$))N @$&*N /@$*$N

Correlaciones intra/grupo com2inadas entre las varia2les discriminantes G las !unciones discriminantes cannicas tipi!icadas Caria2les ordenadas por el tamaQo de la correlacin con la !uncin4 N4 MaGor correlacin a2soluta entre cada varia2le G cualMuier !uncin discriminante4 a4 Esta varia2le no se emplea en el anlisis4

'n este caso no tiene muc<o sentido por;ue ya <emos seleccionado las variables independientes. %asaremos a la representacin &rafica
F n$iones en los $entroides de los 6r /os 5uncin $ /@')* @+*, /@+*% @(*#

PR?M?COA $ # ( +

# /@#)) /@,$' @#($ /@,$$

5unciones discriminantes cannicas no tipi!icadas evaluadas en las medias de los grupos

Estad4sti$os de $lasi,i$a$in
Res men del /ro$eso de $lasi,i$a$in Procesados EAcluidos $*# , , $*# Cdigo de grupo perdido o !uera de rango Perdida al menos una varia2le discriminante <sados en los resultados

%robabilidades /re8ias /ara los 6r /os Casos utili=ados en el anlisis No ponderados Ponderados #% #%@,,, (, (,@,,, +$ +$@,,, *# *#@,,, $*# $*#@,,,

PR?M?COA $ # ( + Total

Previas @#', @#', @#', @#', $@,,,

Mapa territorial (Asumiendo que todas las funciones excepto las dos primeras son = 0) Discriminante cannica Funcin 2 -3,0 -2,0 -1,0 ,0 1,0 2,0 3,0 3,0 32 32 32 32 32 32 2,0 32 32 342 342 3442 3442 1,0 34 42 34 42 34 42 333333 34 42 1111113333333 34 42 111111133333333 * 34 42 ,0 111111113333333 34 ** 1111111334 42 * 114 42 14 42 14 42 14 42 -1,0 14 42 1442 1442 12 12 12 -2,0 12 12 12 12 12 12 -3,0 12 -3,0 -2,0 -1,0 ,0 1,0 2,0 3,0 Funcin discriminante cannica 1 Smbolos usados en el mapa territorial Smbol Grupo Etiqueta ------ ----- -------------------1 2 3 4 * 1 2 3 4 Indica un centroide de grupo

!unciones discriminantes cannicas


(

$ ( , + # $

PR?M?COA
C e n tro id es d eg rupo +

5uncin #

/$

( #

/# /( /# /$ , $ # (

5uncin $

"on esta informacin usamos la funcin discriminante !: no podemos usar la 0. "on la funcin discriminante !9 Prupo ! y &rupo 4 se pueden discriminar: ya ;ue estn le(os <oriBontalmente. Prupo ! y &rupo 0 se pueden discriminar: ya ;ue estn le(os <oriBontalmente. Prupo ! y &rupo $ es dif.cilmente clasificable: ya ;ue estn cerca <oriBontalmente. Prupo $ y &rupo 4 se pueden discriminar: ya ;ue estn le(os <oriBontalmente. Prupo $ y &rupo 0 se pueden discriminar: ya ;ue estn le(os <oriBontalmente.
a Res ltados de la $lasi,i$a$in

?riginal

Recuento

PR?M?COA $ # ( + $ # ( +

rupo de pertenencia pronosticado # ( + $+ + % # ' $) & , $$ $, $% $ $# #) #, # +)@( $(@) ($@, *@% $*@& *,@, #(@( @, #*@) #+@+ +*@( #@+ $%@+ +'@# (#@( (@#

Total #% (, +$ *# $,,@, $,,@, $,,@, $,,@,

a4 Clasi!icados correctamente el (#@&I de los casos agrupados originales4

Mna aplicacin prctica del Anlisis Discriminante es validar el Anlisis "luster. Puardando el resultado del anlisis cluster en una variable: y realiBando posteriormente el AD con la nueva variable creada.

E3ercicio 1. Pu criterio se podr)a utili+ar para decidir qu variable independiente debe incluirse en las funciones discriminantes? 2. .n qu se diferencian el anlisis discriminante m8ltiple! el anlisis de regresin! el anlisis multivariante de la varian+a 0/2-E521! " la regresin log)stica? 3. .#plique los siguientes trminos$ funcin discriminante! coeficientes estandari+ados! " cargas discriminantes. '. ;e reali+ una encuesta a cuatro promociones de estudiantes de la Fniversidad de 2lcal! en la que se midieron las actitudes ,acia la empresa " los sistemas econmicos. &nterprete la siguiente salida de ;P;; del anlisis discriminante$ *. 2 continuacin! se obtuvieron las siguientes tablas. Plantee una conclusin del anlisis discriminante a partir de la siguiente informacin. +. @u! criterio se podr(a utili)ar para decidir u! variable independiente debe incluirse en las funciones discriminantes" 'n el anlisis discriminante -AD/ eCisten dos m#todos de estimacin9 la estimacin con(unta o simultnea y la estimacin por pasos o etapas. 'n el D2A3' slo est implementada la estimacin con(unta mientras ;ue en el % estn ambos m#todos de estimacin. 7a estimacin por etapas produce resultados ms conservadores y se eliminan las variables ;ue no contribuyen a la capacidad discriminatoria. 's decir9 es un m#todo para seleccionar las variables ;ue contribuyen y ;ue tienen el nivel de si&nificacin ms importante y son incluidas finalmente en la funcin discriminante. "uando efectuamos un AD mediante % : >nicamente nos salen las variables son suficiente capacidad discriminatoria. 7as car&as slo salen para todas las variables independientes. 7a importancia o pesos de cada variable independiente son los coeficientes de correlacin cannicas. 6enta(as9 la estimacin con(unta es ms sencilla. i utiliBamos D2A3': <ay ;ue realiBar un A356A univariante -para medir si las medias son si&nificativamente diferentes o distintas/ para poder seleccionar las variables con ms si&nificacin estad.stica y lue&o realiBar el AD. "uando tenemos solamente dos &rupos: se emplea la t de tudent. 2. ,n u! se diferencian el anlisis discriminante m3ltiple$ el anlisis de regresin$ el anlisis multivariante de la varian)a 7MAABCA8$ % la regresin log(stica" 4e&resin m>ltiple -4M/ Anlisis discriminante -AD/ 2 E f G D!F! G D0F0 G ... G DnFn dE a G X!F! G X0F0 G ... G XnFn

'l MA356A es la inversa del AD: donde la variable dependiente es la independiente. 7a 4e&resin 7o&.stica -47/ es un caso particular del AD:

donde la variable dependiente es nominal -dicotmica/ y la independiente es m#trica. 3. ,&pli ue los siguientes t!rminos: funcin discriminante$ coeficientes estandari)ados$ % cargas discriminantes. 7a )uncin Discriminante -)D/ es una combinacin lineal de dos o ms variables ;ue contienen una serie de puntuaciones d. X!: X0: ... :Xn son coeficientes discriminantes ;ue son anlo&os a los coeficientes de la re&resin m>ltiple. 'stos coeficientes representan las contribuciones relativas de sus variables asociadas a las funciones discriminantes. ?%or ;u# se estandariBan las variablesU e estandariBan por ;ue nos son valores directamente comparables. 7as car&as discriminantes son t#cnicamente seme(antes a las obtenidas mediante el A"%. Miden la correlacin lineal simple entre cada variable independiente y la )D. 4efle(an tambi#n la varianBa ;ue eCiste entre las variables independientes y la )D obtenida. 'sta >ltima cuestin est muy relacionada con el concepto de Autovalor. 2. 5e reali) una encuesta a cuatro promociones de estudiantes de la Universidad de Alcal$ en la ue se midieron las actitudes *acia la empresa % los sistemas econmicos. Interprete la siguiente salida de 5P55 del anlisis discriminante: 'l M de 8oC sirve para comprobar el supuesto de la i&ualdad de las matrices de covarianBas o de dispersin. 'ntre dos o ms &rupos de debe 1:1$ es un nivel aceptable. ser si&nificativo. 'n este caso tenemos 1:109: por lo ;ue podemos Res ltados de la /r eba M de >oA considerarlo vlido. '$,@)$(
5 AproA4 gl$ gl# Sig4 $@$+& (*, (#$,+@))( @,#%

A to8alores 5uncin $ # Autovalor @(&%-a. @$*&-a. I de varian=a *$@* #&@$ I acumulado *$@* ))@& Correlacin cannica @'#+ @(&)

( @,&,-a. $$@( $,,@, @#'' a Se 8an empleado las ( primeras !unciones discriminantes cannicas en el anlisis4

'sta tabla no contiene informacin si&nificativamente estad.stica. 'l autovalor si&nifica la varianBa representada por la )D. 7as correlaciones cannicas al cuadrado proporcionan una estimacin de la cantidad de varianBa compartida entre las respectivas combinaciones lineales ptimamente estimadas entre las variables independientes y las dependientes. Zunto con la informacin proporcionada por la 0e y $e columna se puede decir ;ue la )D ! representa el *!:*S de la varianBa y ;ue la )D 0 y )D $: eCplican slo el $,:4S.

Lambda de 9il:s Contraste de las !unciones $ a la ( # a la ( ( Lam2da de Lil3s @')$ @),$ @%(' C8i/cuadrado )#@#&* ((@'*+ $,@$)$ l +' #) $( Sig4 @,,$ @#$* @*&%

'l lambda de XilOs es un eCamen estad.stico para ver si las )D tienen si&nificacin estad.stica. 7a >nica )D vlida ser.a la primera por lo ;ue solamente ser utiliBada para anlisis posteriores.

4. A continuacin$ se obtuvieron las siguientes tablas. Plantee una conclusin del anlisis discriminante a partir de la siguiente informacin. 7a tabla corresponde a una salida donde se <a efectuado un A356A univariante de forma con(unta para comprobar la si&nificacin estad.stica de las variables independientes y poderlas as. incluirlas en la )D. 7as variables a incluir son '%M]58 5: 7I8'4A7: 'M%4]"4': 8'3]58Z! y MA4L]3'".
%r ebas de i6 aldad de las medias de los 6r /os Lam2da de Lil3s @%)* @%+( @%%* @%') @%'( @%#( @%%, @%&% @%)% @%,$ @%&) @%(# @%)% @%)# @%(, 5 @&(, (@$)$ @#(+ #@(#) #@'%' +@(&$ @'(+ $@$'* @'*, '@&&$ $@#,( (@)'& @'*# @%%$ (@%(+ gl$ ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( gl# $') $') $') $') $') $') $') $') $') $') $') $') $') $') $') Sig4 @'(* @,#* @)&( @,&& @,'+ @,,' @**, @(#% @*+# @,,$ @($$ @,$$ @*+$ @(%% @,$,

EP<O?>EC EP<O?>S? DIREOS<5 ECMEOPLA DESPOLI> LI>ERAL ECS?LMER S?CIALIS C?M<NISM EMPROCRE EMPROE;P >ENO?>P$ >ENS?LAC >ALOS?CI MAREONEC

Coe,i$ientes estandari0ados de las , n$iones dis$riminantes $anni$as 5uncin $ # (

EP<O?>EC EP<O?>S? DIREOS<5 ECMEOPLA DESPOLI> LI>ERAL ECS?LMER S?CIALIS C?M<NISM EMPROCRE EMPROE;P >ENO?>P$ >ENS?LAC >ALOS?CI MAREONEC

/@,+# /@+#% @#%$ @,*$ @,$# @(+) /@,)* /@,(& @(*, @&#$ @,%) /@++& /@$+# /@,(' /@#,#

@$'( /@,+( @$&# @+'# @+#, @$*% /@$*$ @$+) @$++ /@',% /@,%, @'(& @$$+ /@#,' /@+%)

@##) @$(% @##+ @,#% /@+%# /@$%# /@#,( @+#% /@#&% @+*( /@#(* @#%( @##+ @$#% /@(*%

%ara la )D: dos variables tienen si&no positivo y tres ne&ativos. A la <ora de interpretar )D tenemos ;ue tener en cuenta estos efectos.

!unciones discrim inantes cannicas


(

( + $ #

PR ? M ? C OA
C e n tro id e sd eg ru p o + 0S e Ata -) + B) ' . ( 0K u in ta -) ( B) + .

/$

5uncin #

/# # 0C u a rta -) # B) ( . /( /+ /( /# /$ , $ # ( + $ 0T e rce ra -) $ B) # .

5u ncin $

%ara este mapa territorial >nicamente debemos considerar la )D !: ya ;ue es la >nica ;ue <a salido estad.sticamente si&nificativa.

Res ltados de la $lasi,i$a$in2a3 PR?M?COA $ ?riginal Recuento $ $& rupo de pertenencia pronosticado # ( ( & + # #% Total

# ( +

) ) '

$# ' $(

( #$ $*

& & #)

(, +$ *#

Tenemos ;ue calcular los resultados obtenidos a partir de esta matriB de confusin9 -!+G!0G0!G0,/N-09G$1G4!G*0/E1:4,!: es decir ;ue el 4,:!S de las variables estn correctamente clasificadas.

TEMA /: EL ANQLSIS *ulti+ariante de la +arian8a 6MANOVA2

Estructura de la clase: 1. Introduccin. . !e"inicin % o'3eti+o. #. T.r*inos % conce&tos '(sicos del MANOVA. ). Su&uestos '(sicos del MANOVA. ,. !ise$o del estudio con el MANOVA. -. Casos &r(cticos con S0SS. Introduccin. : El MA57NA es la extensi-n multivariante de las tcnicas univariantes y sirve para valorar las diferencias entre las medias de varios grupos con m ltiples varia!les. : El MA57NA y el A% son +im"genes de espejo,. Las +aria'les !E0EN!IENTES en el MANOVA 6una serie de +aria'les *.tricas2 son las +aria'les IN!E0EN!IENTES en el A! % una si*&le +aria'le !E0EN!IENTE 6no *.trica2 del A! se con+ierte en la +aria'le IN!E0EN!IENTE en el MANOVA. : *as diferencias entre el MA57NA y el A%, sin em!argo, se centran alrededor de los o!jetivos de los an"lisis y el papel de las varia!les no mtricas. El A% emplea una varia!le no mtrica como varia!le dependiente. (e supone que las categor&as de la varia!le dependiente est"n dadas y que se utilizan las varia!les independientes para formar valores te-ricos que son diferentes de manera m"xima entre los grupos formados por las categor&as de la varia!le dependiente. En el MA57NA por el contrario, la serie de varia!les mtricas act an ahora como varia!les dependientes y el o!jetivo es encontrar grupos de encuestados que exhi!en diferencias so!re la serie de varia!les dependientes. *os grupos de encuestados no son especificados previamente^ en su lugar, el investigador utiliza una o m"s varia!les independientes #no mtricas$ para formar grupos #2air et al., 0GGG, pp.4:0$.

I0or Ju. se usa el MANOVAK 1ara contrastar las medias de dos grupos se utiliza el test t de (tudent.
rupos Calor de t de pN Student A > Caria2le mHtrica Media A Media > AA AA i p es menor ;ue el nivel de si&nificacin previamente establecido: se debe rec<aBar la <iptesis nula -Media A E Media 8/: y por ello: concluir ;ue eCiste diferencia si&nificativa entre las dos medias -Media A Media 8/.

Cuando queremos contrastar medias de tres o m"s grupos, podemos llevar a ca!o m ltiples tests t separados para contrastar la diferencia entre cada par de medias de una varia!le. (in em!argo, los tests t m ltiples hinchan el porcentaje del error 8ipo 6. El A57NA evita este aumento del error de 8ipo 6 al comparar un conjunto de grupos. 1or ello, para contrastar conjuntamente las medias de tres o m"s grupos de una varia!le se utiliza el A57NA.
rupos Calor de F pN A > C Caria2le mHtrica Media A Media > Media C AA AA i p es menor ;ue el nivel de si&nificacin previamente establecido: se debe rec<aBar la <iptesis nula -Media A E Media 8 E Media "/: y por ello: concluir ;ue eCisten diferencias si&nificativas entre las tres medias -Media A Media 8 Media "/.

(i queremos examinar las medias de tres o m"s grupos respecto a m ltiples varia!les, podr&amos aplicar el A57NA varias veces a cada una de las varia!les por separado. (in em!argo, con la misma l-gica aplicada con los tests t m ltiples, la repetici-n del A57NA aumenta el error de 8ipo 6. El MA57NA evita este pro!lema, y es m"s adecuado para examinar las medias de m ltiples grupos respecto a m ltiples varia!les.
rupos pN Lam2da de F Lil3sN A > C Caria2le mHtrica $ Media A$ Media >$ Media C$ AA AA Caria2le mHtrica # Media A# Media ># Media C# AA AA Calor "nico Caria2le mHtrica ( Media A( Media >( Media C( AA AA i p es menor ;ue el nivel de si&nificacin previamente establecido: se puede decir ;ue eCisten diferencias univariantes -Media A Media 8 Media "/. in embar&o: el poder del MA356A es permitir detectar diferencias multivariantes eCaminando el I7ambda de XilOsJ.

;in embargo! los contrastes individuales ignoran las correlaciones entre las variables dependientes (mtricas) " por ello no se emplea toda la informacin disponible para valorar diferencias globales en los grupos. Por ello! el /2-E52 computa un valor 8nico =4ambda de NilOs> para detectar diferencias multivariantes. 8anto el A57NA como el MA57NA son particularmente tiles cuando se usan conjuntamente con dise.os experimentales en los que el investigador controla o manipula directamente una o m"s varia!les independientes para determinar su efecto so!re una #A57NA$ o m"s #MA57NA$ varia!les dependientes #2air et al., 0GGG, pp.4?B$.

!e"inicin % o'3eti+o. El MA57NA es una tcnica de dependencia que mide las diferencias entre dos o m"s varia!les mtricas dependientes !asadas en un conjunto de varia!les categ-ricas independientes. El MA57NA nos permite' *. detectar diferencias glo!ales de!ido a la com!inaci-n de las varia!les dependientes #mtricas$ que no se encuentran con los contrastes univariantes #Caso 1$. 7. realizar el examen de m ltiples varia!les independientes #no mtricas o categ-ricas$ #Caso $. =. controlar el porcentaje glo!al del error de 8ipo 6. Casos en los Jue es adecuado utili8ar el MANOVA : a. Caso 1: 0re1untas so're *=lti&les +aria'les de&endientes 6*.tricas2 % una +aria'le inde&endiente 6no *.trica2. En este caso el investigador pretende realizar preguntas so!re m ltiples varia!les dependientes #por ejemplo, renta, consumo, etc.$ que quiere analizar por separado, controlando el porcentaje de error de 8ipo 6. En esta situaci-n, el MA57NA en primer lugar valora si se encuentra alguna diferencia glo!al entre grupos.
Caria2le independiente -no mHtrica. Lam2da de Lil3sN -valor "nico. p

Clase social

El an"lisis se continua llevando a ca!o contrastes univariantes separados para dar respuestas individuales a cada varia!le dependiente #mtrica$.
Caria2le independiente -no mHtrica. Clase social Alta Media >a9a Variables Caria2le $ de/endientes Caria2le # -mHtricas. Caria2le (

'. Caso : 0re1untas so're *=lti&les +aria'les de&endientes 6*.tricas2 % *=lti&les +aria'les inde&endientes 6no *.tricas2. En este caso el investigador pretende realizar preguntas so!re dos o m"s varia!les independientes #por ejemplo, sexo, clase social, etc.$ y examinar si existen unas determinadas relaciones entre ellas. El MA57NA proporciona un mtodo estructurado para especificar las comparaciones de las diferencias de los grupos so!re un conjunto de medidas dependientes mientras se mantiene la eficiencia estad&stica.
Lam2da de Lil3sN -valor "nico. Lam2da de Lil3sN -valor "nico. Lam2da de Lil3sN -valor "nico. p

Caria2le independiente -no mHtrica.

Clase social

Caria2le independiente -no mHtrica.

SeAo

Caria2les independientes -no mHtrica.

Clase Social ; SeAo

Caria2les independientes -no mHtrica. Clase social Alta Media >a9a Fom2re Mu9er Fom2re Mu9er Fom2re Mu9er Variables Caria2le $ de/endientes Caria2le # -mHtricas. Caria2le (

T.r*inos % conce&tos '(sicos del MANOVA. Caso 1: *=lti&les +aria'les de&endientes 6*.tricas2 % una +aria'le inde&endiente 6no *.trica2. (upongamos, por ejemplo, que identificamos una varia!le categ-rica #independiente$, +clase social,, con tres categor&as' alta, media y !aja. 1retendemos estudiar si existen diferencias importantes entre estas tres clases sociales, teniendo en cuenta tres varia!les dependientes #mtricas$, que son' renta, consumo de refrescos mensual y gasto en agua mensual. 1ara ello, seleccionar&amos tres grupos de personas de clase alta, media y !aja, y les pedir&amos que valorasen en una escala mtrica su renta, su consumo de refrescos y su gasto de agua. A continuaci-n, calcular&amos las medias para cada grupo y para cada valor de la varia!le dependiente, que se indicar&an en las celdas som!readas de la ta!la siguiente.
Alta Variables de/endientes -mHtricas. Renta Consumo de re!rescos mensual asto en agua mensual Clase social Media >a9a

El MA57NA sigue los siguientes pasos' Paso +: El MA57NA detecta diferencias combinadas que no se encuentran con los contrastes univariantes. Existen cuatro criterios muy conocidos con los que valorar las diferencias multivariantes entre los grupos' la mayor ra&z caracter&stica de 9oy, la traza de 2otelling, el lam!da de Xil@s, y el criterio de 1illai. Estos criterios valoran las diferencias entre dimensiones de las varia!les dependientes. El contraste m"s com nmente empleado para la significaci-n glo!al del MA57NA es el lam!da de Xil@s. Este examen estad&stico considera todas las ra&ces caracter&sticas, es decir, compara si los grupos son de alg n modo diferentes sin estar afectados por el hecho de que los grupos difieran en al menos una com!inaci-n lineal de las varia!les dependientes.

Aunque la computaci-n del lam!da de Xil@s es compleja, se tienen !uenas aproximaciones para contrastar la significaci-n, transform"ndolo en un estad&stico ).
Lam2da de Lil3sN -valor "nico.

Caria2le independiente -no mHtrica.

Clase social

Paso 2$ 2 continuacin! el /2-E52 detecta las diferencias univariantes mediante el contraste 3 o el 2-E52 univariante.

Caria2le independiente -no mHtrica. Clase social Alta Media >a9a Variables Renta de/endientes -mHtricas. Consumo de re!rescos mensual asto en agua mensual

Caso : *=lti&les +aria'les de&endientes 6*.tricas2 *=lti&les +aria'les inde&endientes 6no *.tricas2.

(upongamos, por ejemplo, que identificamos dos varia!les independientes #categ-ricas$, +l&nea de producto, y +tipo de cliente,. Cada una de ellas tiene dos categor&as, producto 0 y producto 3 para la varia!le +l&nea de producto, y cliente anterior y cliente actual para +tipo de cliente,. Com!inando estas dos varia!les independientes formamos los cuatro grupos siguientes #8a!la 0$'
Tabla ( Caria2le RlJnea de productoS Caria2le Rtipo de clienteS Cliente anterior Cliente actual Producto $ rupo $ rupo # Producto # rupo ( rupo +

1retendemos estudiar c-mo stas varia!les categ-ricas causan diferencias en la manera en que la gente eval a la pu!licidad de una determinada marca, concretamente en +recuerdo, y +compra, #varia!les dependientes$. 1ara ello, preguntar&amos a individuos de cada uno de los grupos anteriores que valorasen en una escala mtrica +recuerdo, y +compra,. A continuaci-n calcular&amos las medias para cada grupo y para cada valor de la varia!le dependiente #mtrica$ que se indicar&an en las celdas som!readas de la ta!la 3.
Tabla ) Caria2les independientes -no mHtrica. LJnea de producto Producto $ Producto # Cliente Cliente Cliente Cliente anterior actual anterior actual -grupo $. -grupo #. -grupo (. -grupo +. Variables Recuerdo de/endientes Compra -mHtricas.

1odemos usar el MA57NA para com!inar estas dos varia!les dependientes #recuerdo y compra$ en un nico valor te-rico, de forma idntica al A%.

R
/.D&2 K FPE '

/edias
/edias

Producto /
/.D&2 K FPE 2 QK FEP ' Producto 1 /.D&2 K FPE 2 /.D&2 K FPE 1 QK FEP 2 Producto 2

d1

d2

Producto +
/.D&2 K FPE 3 QK FEP '

/.D&2 K FPE 3

(liente anterior /.D&2 K FPE 1 QK FEP 3

(liente actual

/.D&2 K FPE 1

Cliente anterior

Cliente actual

El gr"fico de arri!a representa en el eje C el tipo de cliente y en el eje K la media, y en l se indica con el s&m!olo las cuatro medias de dicho valor te-rico para cada uno de los grupos #estos s&m!olos representar&an la media de cada columna de la 8a!la 3$. *as dos l&neas continuas conectan los dos tipos de cliente #cliente anterior y cliente actual$ para un mismo tipo de producto #producto 0 y producto 3$. *as dos l&neas discontinuas verticales conectan los dos tipos de productos para un mismo tipo de cliente. *os s&m!olos de la figura indican la media para cada categor&a de una de las dos varia!les independientes calculada sin distinguir las categor&as que adopta la otra varia!le independiente, es decir, lo que podemos denominar la +media de la categor&a, de las varia!les independientes #categ-ricas$. El c"lculo de dicha +media de la categor&a, nos permite evaluar c-mo el tipo de producto y)o el tipo de cliente influye en las varia!les dependientes #mtricas$. (iguiendo con el ejemplo, un examen visual del gr"fico anterior pone de manifiesto que la diferencia entre medias para el tipo de cliente #distancia +d0, en el gr"fico$ es mayor que la diferencia entre las medias para el tipo de producto #distancia +d3, en el gr"fico$. 8odo ello nos permite concluir que am!as caracter&sticas #tipo de producto y tipo de cliente$ causan diferencias significativas, un resultado que no es posi!le o!tener con el an"lisis discriminante.

El MA57NA difiere del A% en la manera en que se forman y se analizan los grupos. (-lo podr&a llevarse a ca!o el A% so!re los cuatro grupos, sin distincin de las caracter.sticas del &rupo. Con el MA57NA, el investigador analiza las diferencias entre los grupos a la vez que valora si las diferencias se de!en al tipo de producto, al tipo de cliente o a am!os. 1or tanto, el MA57NA se centra en el an"lisis so!re la composici-n de los grupos !asada en sus caracter&sticas #es decir, en las varia!les independientes$.

Su&uestos '(sicos del MANOVA. Ta*a$o *uestral: 0$ El tama.o de cada grupo m&nimo de!e ser de 3; o!servaciones. 3$ El tama.o de cada +celda, de!e ser m"s grande que el n mero de varia!les dependientes incluidas. Su&uestos 1enerales: 0$ *inealidad. 3$ El conjunto de las p/varia!les dependientes de!e seguir una distri!uci-n normal multivariante #en la pr"ctica, este supuesto 57 se puede compro!ar con (1((^ por ello se de!e asegurar que cualquier com!inaci-n de las varia!les dependientes sigue una distri!uci-n normal$. Su&uestos es&ec5"icos: 0$ *as o!servaciones de!en ser independientes. 3$ *as matrices de varianzas_covarianzas de!en ser iguales para todos los grupos de tratamiento #M de Oox^ en (1((, seleccione +7pciones, +1rue!as de homogeneidad,$. 4$ *a ausencia de la multicolinealidad.

0otencia estad5stica de los contrastes *ulti+ariantes: En trminos sencillos, la potencia es la pro!a!ilidad de que el contraste estad&stico identifique un efecto del +tratamiento, si este realmente existe. *a potencia puede ser definida como uno menos la pro!a!ilidad del error de 8ipo 66 #!eta$. El investigador de!e considerar, no s-lo el nivel de significaci-n alfa, sino tam!in la potencia resultante, y de!e intentar mantener un nivel de significaci-n alfa acepta!le con una potencia cerca de ;,F;. El (1(( ofrece una opci-n para compro!ar el nivel de la potencia #+7pciones, +1otencia o!servada,$. 8ras realizar el MA57NA, el investigador de!e determinar primero si la potencia o!tenida fue suficiente, es decir, ;,F; o m"s. (i no fuese as&, y especialmente si no se han encontrado diferencias significativas, el investigador podr&a reformular el dise.o de an"lisis.

!ise$o del estudio con el MANOVA. 7!jetivos del estudio con el MA57NA. Examen de los supuestos. Estimaci-n del modelo MA57NA y valoraci-n del ajuste glo!al. An"lisis so!re efectos de interacciones. 6nterpretaci-n de los resultados.

Casos &r(cticos con S0SS. MtiliBaremos el arc<ivo AD] % .

Al i&ual ;ue <icimos en el AD: esco&emos las si&uientes variables dependientes9 '%M]58 5 7I8'4A7 'M%4]"4' 8'3]58Z! MA4L]3'"

"omo variable independiente o )actor )i(o %45M5"]A

'n 5pciones ele&imos %ruebas de =omo&eneidad:

7as salidas de %

son las si&uientes9

%r eba de Bo1 sobre la i6 aldad a de las matri$es de $o8arian0a M de >oA &#@$+, 5 $@',$ gl$ +' gl# (*%)(@*&+ Signi!icacin @,$* Contrasta la 8iptesis nula de Mue las matrices de covarian=a o2servadas de las varia2les dependientes son iguales en todos los grupos4 a4 DiseQo0 InterceptTPR?M?COA

'l nivel de si&nificacin obtenido es 1:1!* Q 1:15: por lo ;ue las matrices de varianBasAcovarianBas no son i&uales. %odemos decir ;ue no se cumple el test de M de 8oC.
$ Contrastes m lti8ariados

E!ecto Intercept

Tra=a de Pillai Lam2da de Lil3s Tra=a de Fotelling RaJ= maGor de RoG PR?M?COA Tra=a de Pillai Lam2da de Lil3s Tra=a de Fotelling RaJ= maGor de RoG

a fi(ar en el #'!0+' +* G%#H1. 'n a4 EstadJstico eAacto este caso sale 24 El estadJstico es un lJmite superior para la 5 el cual o!rece un lJmite in!erior para el nivel de si&nificativo: por lo ;ue signi!icacin4 podemos decir ;ue c4 DiseQo0 InterceptTPR?M?COA eCisten diferencias multivariantes o &lobales si&nificativas con las variables seleccionadas.

Calor @%&, @,(, (#@+%% (#@+%% @(#' @*%% @(%& @#%,

5 $,,,@%&) a $,,,@%&) a $,,,@%&) a $,,,@%&) a (@&%+ (@%(( +@,+( %@,'( 2

l de la 8iptesis '@,,, '@,,, '@,,, '@,,, $'@,,, $'@,,, $'@,,, '@,,,

l del error Signi!icacin $'+@,,, @,,, $'+@,,, @,,, $'+@,,, @,,, $'+@,,, @,,, +*)@,,, @,,, +#'@'#) @,,, +')@,,, @,,, lo nos vamos $'*@,,, @,,,

7as pruebas de los efectos interAsu(etos sirven para ver si eCisten diferencias univariantes. Mediante el MA356A se pueden ver si eCisten diferencias univariantes y multivariantes.

%r ebas de los e,e$tos inter<s =etos Suma de cuadrados tipo III )@+$# a $(@+*) 2 #+@,%( c $*@+,) d $$@)(* e ##,$@)+, $$()@,%) $#,+@+%) $#$$@)*) &*$@#+, )@+$# $(@+*) #+@,%( $*@+,) $$@)(* $(%@#*& $*#@#*& #$%@)*+ ##+@,(* $')@++$ #+%,@,,, $+%%@,,, $*#'@,,, $'')@,,, %'&@,,, $+&@*&% $&'@&(' #+(@%'& #+,@+++ $&,@#&) Media cuadrtica #@),+ +@+)% )@,($ '@+*% (@%+' ##,$@)+, $$()@,%) $#,+@+%) $#$$@)*) &*$@#+, #@),+ +@+)% )@,($ '@+*% (@%+' @))$ $@,#& $@(%# $@+$) $@,,(

5uente Caria2le dependiente Modelo corregido EP<O?>S? LI>ERAL EMPROCRE >ENO?>P$ MAREONEC Intercept EP<O?>S? LI>ERAL EMPROCRE >ENO?>P$ MAREONEC PR?M?COA EP<O?>S? LI>ERAL EMPROCRE >ENO?>P$ MAREONEC Error EP<O?>S? LI>ERAL EMPROCRE >ENO?>P$ MAREONEC Total EP<O?>S? LI>ERAL EMPROCRE >ENO?>P$ MAREONEC Total corregida EP<O?>S? LI>ERAL EMPROCRE >ENO?>P$ MAREONEC

gl ( ( ( ( ( $ $ $ $ $ ( ( ( ( ( $') $') $') $') $') $*# $*# $*# $*# $*# $*$ $*$ $*$ $*$ $*$

5 (@$)$ +@(&$ '@&&$ (@)'& (@%(+ #+%)@,,* $$,)@$&, )*'@')' )'+@**$ &'%@$$% (@$)$ +@(&$ '@&&$ (@)'& (@%(+

Signi!icacin @,#* @,,' @,,$ @,$$ @,$, @,,, @,,, @,,, @,,, @,,, @,#* @,,' @,,$ @,$$ @,$,

a4 R cuadrado : @,'& -R cuadrado corregida : @,(%. 24 R cuadrado : @,&& -R cuadrado corregida : @,'%. c4 R cuadrado : @,%% -R cuadrado corregida : @,)#. d4 R cuadrado : @,*) -R cuadrado corregida : @,'$. e4 R cuadrado : @,&, -R cuadrado corregida : @,'#.

MANOVAS1

Mod lineal &eneral multivariante

5pciones9

4esultados9
%r eba de Bo1 sobre la i6 aldad de las matri$es de $o8arian0a2a3 M de >oA #&*@(+& 5 '@%') gl$ gl# Signi!icacin +, $$+$@))# @,,,

Contrasta la 8iptesis nula de Mue las matrices de covarian=a o2servadas de las varia2les dependientes son iguales en todos los grupos4 a DiseQo0 InterceptTED<CAC

Tenemos ;ue mencionar y (ustificar tericamente por;u# nos <a salido si&nificativo.

A<ora vamos a realiBar un Anlisis Discriminante: por lo ;ue tenemos ;ue invertir las 6I y las 6D.

%rimero tenemos ;ue cambiar esta variable a num#rica9 nivel de educacin. 'n ran&o ponemos m.nimo ! y mCimo 4.

2 en estad.sticos seleccionamos A356A y M de 8oC. Aceptar Tenemos $ funciones discriminantes pero solo la primera <a salido si&nificativa. 2 antes de 8oC tenemos una tabla ;ue ofrece eC univariante. =emos obtenido la misma informacin ;ue el MA356A.
%r ebas de i6 aldad de las medias de los 6r /os Lam2da de Lil3s @%%' @%'% @%)* @%&$ 5 $@+'+ $#@$$' +@$,' )@#*) gl$ ( ( ( ( gl# )+$ )+$ )+$ )+$ Sig4 @##* @,,, @,,& @,,,

Edad -aQos. Renta anual -en mil. Deuda de tar9eta de credito ?tras deudas

MANOVAS

)c fi(o9 )umador o no. 6ariables dependientes9 las de actitudes -4 variables/. M de boC no si&nificativo cumple supuesto 7a 6I es fumador o no: lambda de `ilOs <a salido 1:!40: no si&nificativo: por lo ;ue no <ay diferencias multivariantes. 3o son interesa el anlisis posterior. A<ora cambiamos los factores fi(os y ponemos seCo por;ue nos interesa saber si <ay diferencias entre <ombres y mu(eres. 3os sale 1:,,5 por lo ;ue ya nonos interesa. "ambiamos otra veB fc fi(os para saber si <ay diferencias &lobales en los distintos &rupos de clase social. M de boC cumple el supuesto espec.fico. XilOs sale 1:1,0 si tenemos suficiente material biblio&rfico para sostener la <iptesis pues la aceptamos. %ero si es un estudio eCploratorio: rec<aBamos de fi(o. 3o se puede &eneraliBar.
%r eba de Bo1 sobre la i6 aldad de las matri$es de $o8arian0a2a3 M de >oA #,@,*& 5 $@(*% gl$ gl# Signi!icacin $, %(&@,'# @$%,

Contrasta la 8iptesis nula de Mue las matrices de covarian=a o2servadas de las varia2les dependientes son iguales en todos los grupos4 a DiseQo0 InterceptTCLASES?C

Contrastes m lti8ariados2d3 E!ecto Intercept Calor @%#& @,&( $#@&+% $#@&+% @*,* @+,) $@+$+ $@()% 5 ++@*#$-2. ++@*#$-2. ++@*#$-2. ++@*#$-2. $@*(, $@%&)-2. #@#%) '@#$,-c. l de la 8iptesis +@,,, +@,,, +@,,, +@,,, )@,,, )@,,, )@,,, +@,,, l del error $+@,,, $+@,,, $+@,,, $+@,,, (,@,,, #)@,,, #*@,,, $'@,,, Signi!icacin @,,, @,,, @,,, @,,, @$') ;>?@ @,'# @,,) Parmetro de no centralidad $&)@+)* $&)@+)* $&)@+)* $&)@+)* $(@,+, $'@)#, $)@()& #,@)+, Potencia o2servada-a . $@,,, $@,,, $@,,, $@,,, @*,, @*%+ @&*# @)%'

CLASES?C

Tra=a de Pillai Lam2da de Lil3s Tra=a de Fotelling RaJ= maGor de RoG Tra=a de Pillai Lambda de 9il:s Tra=a de Fotelling RaJ= maGor de RoG
a 2 c d

Calculado con al!a : @,' EstadJstico eAacto El estadJstico es un lJmite superior para la 5 el cual o!rece un lJmite in!erior para el nivel de signi!icacin4 DiseQo0 InterceptTCLASES?C

MANOVAS#

"omo variables dependientes. 7ue&o ele&imos 0 6I -cate&ricas/9 Tenemos ;ue reconstruir el anlisis de las fotocopias del profesor s<intaro.
%r eba de Bo1 sobre la i6 aldad de las matri$es de $o8arian0a2a3 M de >oA **@+(, 5 @%++ gl$ gl# Signi!icacin *, '$,&@%&, @'%)

Contrasta la 8iptesis nula de Mue las matrices de covarian=a o2servadas de las varia2les dependientes son iguales en todos los grupos4 a DiseQo0 InterceptTEDADTTRA>APATEDAD N TRA>APA

"umple el supuesto.
Contrastes m lti8ariados2d3
a 2 c d Calculado con al!a : @,' EstadJstico eAacto El estadJstico es un lJmite superior para la 5 el cual o!rece un lJmite in!erior para el nivel de signi!icacin4 DiseQo0 InterceptTEDADTTRA>APATEDAD N TRA>APA

i utiliBamos el MA356A con dos fc fi(os la interpretacin es muy complicada a no ser ;ue bus;uemos al&una interaccin muy espec.fica. %or lo ;ue no es conveniente usar con dos )c fi(os.
AAA Intera$$iones entre an5lisis $l ster . MANOVAB MANOVAC+

%ara anlisis discriminante

%ara MA356A

E3ercicio /
1. Por qu se usa el /2-E52 en ve+ del 2-E52? 2. (ules son las diferencias entre /2-E52 " el anlisis discriminante? Pu situaciones se adecuan a cada tcnica multivariante? 3. (mo se pueden valorar las diferencias multivariantes en el /2-E52? (untos criterios se aplican? (ul es el criterio ms usado " conocido? '. /encione los supuestos espec)ficos del /2-E52. *. 4a base de datos =/2-E52 3> de la pgina Neb trata de una investigacin comercial sobre actitudes ,acia la empresa " los sistemas econmicos de los estudiantes de la Fniversidad de 2lcal. .fect8a el /2-E52 con las siguientes variables " e#plica qu tipo de informacin se debe obtener para el estudio. 5ariables dependientes 0mtricasT slo cinco1$ .PF:EI;E$ 4a empresa p8blica puede cumplir los ob6etivos sociales me6or que la privada. 4&I. 24$ .l liberalismo es la me6or doctrina econmica. ./P U( .$ .l empresario debe ser admirado por la sociedad porque crea rique+a. I.-UEI@1$ .l beneficio debe ser el primer ob6etivo de la empresa. /2 VU-.($ .l marOeting es solo un mtodo para vender ms! creando necesidades aparentes. 5ariable independiente 0no mtrica1 P E/E(U2$ %ercera 0B1<B21! (uarta 0B2<B31! Puinta 0B3<B'1! " ;e#ta 0B'<B*1.

7. ;e reali+ una investigacin acerca de las percepciones ,acia el tabaquismo con B? muestras
de la Fniversidad 2utnoma de /adrid. ;e e#aminaron estudiantes de tres carreras distintas$ 2dministracin " Direccin de .mpresas! Derec,o " Iioqu)mica. ;e plantearon las siguientes preguntas$ 011 3umar per6udica la saludT 021 -o debe permitirse fumar en lugares p8blicosT 031 Deben aumentarse los impuestos sobre el tabaco! " 0'1 Debe intensificarse la informacin sobre los efectos del tabaco en la salud. ;obre la base de la revisin bibliogrfica! se plante la siguiente ,iptesis principal$ W1$ .#isten diferencias significativas globales en dic,as percepciones sobre los efectos de tabaquismo generales. -uestra proposicin es que los estudiantes de ciencias tienden a se9alar actitudes ms negativas contra el tabaquismo. %ras efectuar el /2-E52 con ;P;;! se obtuvieron las siguientes salidas. Waga su interpretacin sobre dic,as salidas " conclu"a el estudio. 0-ota$ se omiti =Potencia observada>.1

Contrastes m lti8ariados2$3 E!ecto Carrera universitaria Calor @*,* @+,) $@+$+ $@()% 5 $@*(, $@%&) #@#%) '@#$, l de la 8iptesis )@,,, )@,,, )@,,, +@,,, l del error (,@,,, #)@,,, #*@,,, $'@,,, Signi!icacin @$') @,)& @,'# @,,)

Tra=a de Pillai Lam2da de Lil3s Tra=a de Fotelling RaJ= maGor de RoG

+. Por u! se usa el MAABCA en ve) del AABCA"

6or )ue se trata de estudiar la varianza de m'ltiples variables dependientes mtricas" El MA/0*A es la e tensi&n multivariante de las tcnicas univariantes y sirve para valorar las di-erentas entre las medias de varios grupos con m'ltiples variables" /o podemos saber si e isten di-erencias globales o di-erencias multivariantes o e-ectos combinados" Cuando )ueremos e aminar las medias de m'ltiples variables mtricas dependientes podr5amos aplicar al A/0*A varias veces a cada una de las variables por separado" Sin embargo la repetici&n del A/0*A hincha el error de tipo ," Adem!s las m'ltiples A/0*As no pueden detectar las correlaciones entre las variables mtricas dependientes" El MA/0*A evita el aumento del error de tipo , y al mismo tiempo permite identi-icar las di-erencias multivariantes respecto a m'ltiples variables"
/. Cules son las diferencias entre MAABCA % el anlisis discriminante" @u! situaciones se adecuan a cada t!cnica multivariante"

8as di-erencias entre el MA/0*A y el A+ se centran alrededor de los ob7etivos de los an!lisis y del papel de las variables no mtricas" 8as di-erencias entre el MA/0*A y el A+ se centran alrededor de los an!lisis y el papel de las variables no mtricas" El A+ emplea una variable no mtrica como variable dependiente" Se supone )ue las categor5as de la variable dependiente est!n dadas y )ue se utilizan las variables independientes para -ormar valores te&ricos )ue son di-erentes de manera m! ima entre los grupos -ormados por las categor5as de la variable dependiente" En el MA/0*A por el contrario la serie de variables mtricas act'an ahora como variables dependientes y el ob7etivo es encontrar grupos de encuestados )ue e hiben di-erencias sobre la serie de variables dependientes" 8os grupos de encuestados no son especi-icados previamente( en su lugar el investigador utiliza una o m!s variables independientes (no mtricas) para -ormar grupos" Ambas tcnicas son complementarias" 9ras realizar el MA/0*A conseguimos datos estad5sticos pero para conocer )ue variable contribuye a las di-erencias multivariantes realizaremos un A+"

0. Cmo se pueden valorar las diferencias multivariantes en el MAABCA" Cuntos criterios se aplican" Cul es el criterio ms usado % conocido"

El MA/0*A detecta di-erencias combinados )ue no se encuentran con los contrastes univariantes" E isten cuatro criterios muy conocidos con los )ue valorar las di-erencias multivariantes entre los grupos: la mayor raz caracterstica de Roy( la traza de Hotelling( el lambda de Wilks( y el criterio Pillai" Estos criterios valoran las di-erencias entre dimensiones de las variables dependientes" El contraste mas com'nmente empleado para la signi-icaci&n global del MA/0*A es el lambda de Wilks" Este e amen estad5stico considera todas las ra5ces caracter5sticas es decir compara si los grupos son de alg'n modo di-erente sin estar a-ectados por el hecho de )ue los grupos di-ieran en al menos una combinaci&n lineal de las variables dependientes"
2. Mencione los supuestos espec(ficos del MAABCA.

upuestos Penerales9 7inealidad. 'l con(unto de las p variables dependientes debe se&uir una distribucin normal multivariante -en la prctica: este supuesto 35 se puede comprobar con % : por ello se debe ase&urar ;ue cual;uier combinacin de las variables dependientes si&uen una distribucin normal/. upuestos espec.ficos9 7as observaciones deben ser independientes. 7as matrices de varianBasAcovarianBas deben ser i&uales para todos los &rupos do tratamiento -M de 8oC H 1:1$: es decir no si&nificativoR en % 9 5pciones pruebas de <omo&eneidad/. 7a ausencia de la multicolinealidad.
4. 6a base de datos :MAABCA 0; de la pgina Deb trata de una investigacin comercial sobre actitudes *acia la empresa % los sistemas econmicos de los estudiantes de la Universidad de Alcal. ,fect3a el MAABCA con las siguientes variables % e&plica u! tipo de informacin se debe obtener para el estudio. Cariables dependientes 7m!tricasE slo cinco8: ,PU1B>5B: 6a empresa p3blica puede cumplir los ob-etivos sociales me-or ue la privada. 6I>,#A6: ,l liberalismo es la me-or doctrina econmica. ,MP#FC#,: ,l empresario debe ser admirado por la sociedad por ue crea ri ue)a. >,AFB>G+: ,l beneficio debe ser el primer ob-etivo de la empresa. MA#HFA,C: ,l marIeting es solo un m!todo para vender ms$ creando necesidades aparentes. Cariable independiente 7no m!trica8 P#BMBCFA: 'ercera 7J+9J/8$ Cuarta 7J/9J08$ @uinta 7J09J28$ % 5e&ta 7J29J48.

Al realizar mediante el M de .o nos sale ;(;<=>;(;? por lo )ue no ha cumplido el supuesto de igualdad y tenemos )ue parar el an!lisis"

7. 5e reali) una investigacin acerca de las percepciones *acia el taba uismo con J<
muestras de la Universidad Autnoma de Madrid. 5e e&aminaron estudiantes de tres carreras distintas: Administracin % Direccin de ,mpresas$ Derec*o % >io u(mica. 5e plantearon las siguientes preguntas: 7+8 .umar per-udica la saludE 7/8 Ao debe permitirse fumar en lugares p3blicosE 708 Deben aumentarse los impuestos sobre el tabaco$ % 728 Debe intensificarse la informacin sobre los efectos del tabaco en la salud. 5obre la base de la revisin bibliogrfica$ se plante la siguiente *iptesis principal: K+: ,&isten diferencias significativas globales en dic*as percepciones sobre los efectos de taba uismo generales. Auestra proposicin es ue los estudiantes de ciencias tienden a seLalar actitudes ms negativas contra el taba uismo. 'ras efectuar el MAABCA con 5P55$ se obtuvieron las siguientes salidas. Kaga su interpretacin sobre dic*as salidas % conclu%a el estudio. 7Aota: se omiti :Potencia observada;.8

Contrastes m lti8ariados2$3 E!ecto Carrera universitaria Calor @*,* @+,) $@+$+ $@()% 5 $@*(, $@%&) #@#%) '@#$, l de la 8iptesis )@,,, )@,,, )@,,, +@,,, l del error (,@,,, #)@,,, #*@,,, $'@,,, Signi!icacin @$') @,)& @,'# @,,)

Tra=a de Pillai Lam2da de Lil3s Tra=a de Fotelling RaJ= maGor de RoG

Empleando el lambda de @ilks como criterio multivariante pare considerar todas las ra5ces caracter5sticas de las variables dependientes (mtricas) el MA/0*A detectar di-erencias globales de las variables dependientes (mtricas)( el MA/0*A detecte di-erencias globales entre las distintas carreras universitarias al nivel de ;(;AB" Se considera aceptable establecer el nivel de signi-icaci&n en ;(<; debido a )ue se trata de un estudio con car!cter e ploratorio" 9eniendo en cuenta el hecho de )ue la hip&tesis o proposici&n -undamental es )ue distintas cameras universitarias e hibir5an di-erencias sobre los e-ectos del taba)uismo( se concluye )ue e isten di-erencias globales entre las distintas carreras universitarias sobre las percepciones del taba)uismo" (8ambda de Cills ;(;AD <;(<;" Es signi-icativo" Cumple la hip&tesis de )ue e isten di-erencias signi-icativas en la percepci&n negativa del tabaco entre alumnos de carreras di-erentes")

%r ebas de los e,e$tos inter<s =etos Suma de cuadrados tipo III $(@,&' '@)&' '@)&' @),, Media cuadrtica # # # # *@'() #@%() #@%() @+,,

5uente Carrera universitaria

Caria2le dependiente U5umar per9udica la saludU UNo de2e permitirse !umar en lugares p"2licosU UDe2en aumentarse los impuestos so2re el ta2acoU UDe2e intensi!icarse la in!ormacin so2re los e!ectos del ta2aco en la saludU

gl

5 &@)*) #@&%+ #@'$( @($(

Signi!icacin @,,+ @,)% @$$$ @&(*

E isten di-erencias signi-icativas en la percepci&n de los alumnos de las cuatro carreras citadas en cuanto a considerar )ue -umar per7udica la salud y )ue no debe permitirse -umar en lugares p'blicos" Sin embargo no e isten di-erencias signi-icativas en las otras variables independientes en -unci&n de la pertenencia a una carrera de ciencias sociales o cient5-icas" 8os contrastes 2 multivariantes para cada variable dependiente (mtricas por separado detectaron di-erencias signi-icativas univariantes con un nivel de signi-icaci&n de ;(<; solo para E2umar per7udica la saludE y Eno debe permitirse -umar el lugares p'blicosE( mientras no identi-ica ninguna di-erencia signi-icativa para Edebe aumentarse los impuesto sobre el tabacoE y Edebe intensi-icarse la in-ormaci&n sobre los e-ectos del tabaco en la saludE" +e ello se puede concluir )ue las di-erencias globales se atribuyen a las di-erencias univariantes sobre dichas dos preguntas y FG los e-ectos combinados de las cuatro variables dependientes (mtricas)" Se necesita no s&lo e aminar las medias para cada par de grupos para conocer si e-ectivamente los estudiantes de la carrera de bio)u5mica muestran una percepci&n m!s -uerte contra el taba)uismo" Sin embargo el presente estudio debe considerarse con un car!cter e ploratorio debido al tamaHo muestral relativamente pe)ueHo( los resultados del estudio no deben generalizarse" Se necesitara una investigaci&n -utura con un mayor n'mero de muestras para obtener conclusiones de-initivas"

TEMA R: LA REGRESIMN LOGTSTICA 6MO!ELO LOGIT2

Estructura de la clase: 1. Introduccin. . O'3eti+o de la RL. #. Modelo de la RL. ). !ise$o del estudio con la RL. ,. Medicin de la +aria'le de&endiente. -. Esti*acin del *odelo. /. Su&uestos '(sicos de la RL. U. Condad de a3uste. R. Inter&retacin de los resultados. 1A. Co*&aracin de los *odelos: re1resin7 discri*inante % lo1it. 11. Casos &r(cticos con S0SS. Introduccin. ?Yu# caracter.sticas del estilo de vida son factores de ries&o de enfermedad cardiovascularU Dada una muestra de pacientes a los ;ue se mide la situacin de fumador: dieta: e(ercicio: consumo de alco<ol: y estado de enfermedad cardiovascular: se puede construir un modelo utiliBando las cuatro variables de estilo de vida para predecir la presencia o ausencia de enfermedad cardiovascular en una muestra de pacientes. 'l modelo puede utiliBarse posteriormente para derivar estimaciones de la raBn de las venta(as para cada uno de los factores y as. indicarle: por e(emplo: cunto ms probable es ;ue los fumadores desarrollen una enfermedad cardiovascular frente a los no fumadores.

O'3eti+o de la RL. .l ob6etivo de la 4 es 0estimar un modelo de dependencia en el ;ue la variable dependiente es cualitativa y binaria mediante una funcin lo&.stica. 8uscamos una combinacin lineal entre las variable dependiente e independiente. 7a variable dependiente <a de ser binaria1.

Modelo de la RL.

!ise$o del estudio con la RL. !. 5b(etivos 0. eleccionar variable dependiente -cate&rica/ e independientes -m#tricas: tambi#n se puede utiliBar variables cate&ricas/. $. upuestos del anlisis 4. 'stimacin del modelo de re&resin lo&.stica y valoracin del a(uste &lobal 5. Interpretacin y bondad de a(uste *. 6alidacin de los resultados %odemos cambiar el orden de los pasos para realiBar el anlisis: realiBar primer el 4: despu#s el $ y lue&o el 0. Tambi#n ser.a vlido. 'n la 4M intentamos minimiBar la suma de los residuos: pero en el 75PIT: no utiliBamos este concepto: por;ue no cumple la linealidad. 'n veB de utiliBar el concepto de residuo: utiliBamos el concepto de "<iA cuadrado.

Medicin de la +aria'le de&endiente. / / 'n el lo&it: se predice la probabilidad de ocurrencia. %or e(emplo: si utiliBa un determinado producto de limpieBa:@ variable no m#trica a/ dicotmica b/ multicotmica9 lo&it multinominal

Esti*acin del *odelo. / / / 6ariables independientes9 cate&ricas o m#tricas. "ate&ricas9 se transforman en ficticias. 'stimacin por mCima probabilidad9 estimadores ms probables para los coeficientes -no minimiBacin de suma de cuadrados: sino maCimiBacin de probabilidad de ocurrencia de un suceso/.

Su&uestos '(sicos de la RL. Tienen ;ue cumplir los si&uientes supuestos9 / 4obusteB del modelo de la 47. 's muy fleCible y poderoso. / Menos restrictivo ;ue el AD -normalidad y <omocedasticidad/: si no cumple estos supuestos podemos utiliBar el 7o&it. / 7a 47 es adecuada cuando no se cumple el supuesto de i&ualdad de las matrices de varianBasAcovarianBas entre &rupos.

Condad de a3uste. '. I2LL -#63'(%$!6 +* #' 9(60'0%#%+'+.: 19 a(uste perfecto -probabilidad !/."uanto mayor sea peor es el a(uste 'n 4M buscamos un coeficiente de determinacin muc<o me(or. 'n 7o&it: nos centramos en el valor del lo&aritmo de la probabilidad: si el valor es 1 el a(uste es perfecto. 0. V'#6( +* J61!*( 8 L'!*1K6L: Mn valor "<iAcuadrado no si&nificativo indica un buen a(uste del modelo. "on esto comparamos el modelo real y el modelo predic<o -si son i&uales ser si&nificativo/. 2. R2 +* N'3*#H*(H*: 19 a(uste malo !9 a(uste perfecto +. C6*:%2%*)$* *1$'+M1$%26 +* G'#+

Inter&retacin de los resultados.


Res men de los modelos

Paso $

/# log de la verosimilitud +)4'()-a.

R cuadrado de CoA G Snell 4$+(

R $ adrado de Na6el:er:e 4#$&

a La estimacin 8a !inali=ado en el n"mero de iteracin ' porMue las estimaciones de los parmetros 8an cam2iado en menos de 4,,$4

3os interesa el 4 cuadrado de 3a&elOerOe: este es anlo&o al coeficiente de determinacin de la 4M. 'stos valores var.an entre 1 y !.
%r eba de Dosmer . LemesEoF Paso $ C8i/cuadrado $#4$(# gl ) Sig4 4$+'

'sta prueba indica el valor de c<i cuadrado: con ella detectamos diferencias si&nificativas. i sale si&nificativo es incorrecto: por;ue el modelo tiene ;ue ser parecido al modelo real: por lo ;ue debe salir no si&nificativo: ser.an muy parecidos. 3o eCiste nin&una diferencia si&nificativa. 'n los datos podemos ver como es no si&nificativo 1:!45.
Tabla de $lasi,i$a$in2a3 ?2servado M#$ 4,, Paso $ M#$ Porcenta9e glo2al a El valor de corte es 4',, 4,, $4,, +, $, $4,, $ # Porcenta9e correcto %&4* $*4& &%4# Pronosticado

'sta tabla es similar a la tabla de clasificacin del AD: matriB de confusin o clasificacin. 'ste es uno de los ob(etivos principales del AD. 7os valores a la derec<a de ;0! determinan la presencia o no de un determinado fenmeno: es la variable dependiente. 'l 41S de la muestra est clasificada correctamente como no fumador -por e(/. in embar&o la clasificacin de presencia de fumador est clasificado por un !*.+S

Variables en la e$ a$in

I4C4 %'4,I para E;P->. > Paso $-a. K$ K# G* K* K& K$( Constante /4+)+ 4$++ (#>H> /4#*# /4+%( 4#&( /$4)+# E4T4 4+)& 4'** #I*) 4+') 4+++ 4',# #4,%# Lald 4%)) 4,*' *#JHH 4(#& $4#(# 4#%' 4&&' gl $ $ ( $ $ $ $ Sig4 4(#, 4&%% #>+H 4'*) 4#*& 4')& 4(&% EAp->. 4*$* $4$'' )#??? 4&&, 4*$$ $4($( 4$'% In!erior 4#(& 4()$ (#>(@ 4($+ 4#'* 4+%$ Superior $4*,$ (4',, ?#)>> $4))) $4+') (4'$$

a Caria2le-s. introducida-s. en el paso $0 K$@ K#@ K(@ K*@ K&@ K$(4

'n este caso <emos utiliBado la estimacin con(unta por lo ;ue <emos metido todas las variables a la veB. 'l eCamen estad.stico en esta tabla ms importante es el test de Xald. Mediante este eCamen estad.stico: podemos incluir o eliminar las variables independientes. 'ste test: es anlo&o al de la t de tudent. 'n 4M se utiliBa para averi&uar si la variable contribuye si&nificativamente al modelo. 'n este caso slo la variable ;$ <a salido si&nificativa aplicando un nivel de si&nificacin de 1.15. INTERPRETACIN C6*:%2%*)$*1 )*3'$%&619 Indican ba(a probabilidad de ocurrencia. C6*:%2%*)$*1 2*(69 no <ay nin&una influencia: es decir: no <ay cambio en el ratio. C6*:%2%*)$*1 961%$%&619 alta probabilidad de ocurrencia. %ara la interpretacin del modelo lo&it <ay ;ue tener en cuenta estos coeficientes beta. ETAPAS: DISENO DE UN MODELO LOGIT Definicin del problema9 5b(etivos9 relacin entre variables S% )6 2"!9#* *# !M)%!6 $'!'O6 !"*1$('# 96( &'(%'0#* K'8 <"* 26!*)$'(#6 *) *# $('0'C6. D*0*(M'!61 $*)*( 15 6 20 601*(&'2%6)*1 96( &'(%'0#*. S% )6 1* 9"*+* 3*)*('#%,'(P $'!0%5) K'8 <"* %)2#"%(#6 *) *# $('0'C6. A1M 26!6 (*26!*)+'2%6)*1 9'(' :"$"('1 %)&*1$%3'2%6)*1.

Co*&aracin de los *odelos: re1resin7 discri*inante % lo1it. D%'961%$%&' 3(>:%261 'n la 4M: buscamos una combinacin lineal entre las variables m#tricas dependientes e independientes. i utiliBamos una variable dicotmica en la 4M: no cumple la linealidad. "omo esto no es vlido. 8uscamos la posibilidad en el 47 o lo&it. A;u. buscamos la probabilidad mCima entre los valores 1 y !. 'n AD: buscamos si las medias son distintas. i no cumple la normalidad no podemos utiliBar esta t#cnica: al i&ual ;ue ocurre con la <omocedasticidad. %or lo ;ue buscamos la solucin en la 7o&.stica. J'8 <"* 1*#*22%6)'( R*3(*1%4) insertamos las variables de estudio. #63M1$%2' 0%)'(%'. 7ue&o

Casos &r(cticos con S0SS.


11.1 Casos &r(cticos con S0SS.

6ariable dicotmica ;ue usaremos como dependiente

%ara mirar el efecto interaccin de las dos variables. e introduce pulsando control y seleccionando ambas variables

7a primera tabla a la ;ue prestaremos atencin es la Tabla de "lasificacin

Re6resin lo64sti$a
Res men del /ro$esamiento de los $asos Casos no ponderados Casos seleccionados
a

N Incluidos en el anlisis Casos perdidos Total &, , &, , &,

Casos no seleccionados Total

Porcenta9e $,,@, @, $,,@, @, $,,@,

a4 Si est activada la ponderacin@ consulte la ta2la de clasi!icacin para ver el n"mero total de casos4

Codi,i$a$in de la 8ariable de/endiente Calor original Calor interno No , Des $

BloK e >B BloK e ini$ial


8lo;ue 1 si&nifica ;ue es el anlisis previo antes de meter las variables predoctoras. olo tenemos en cuenta el valor constante. 3o consideramos variables predictoras.
a;b Tabla de $lasi,i$a$in

Paso ,

?2servado El respeto es importante4 Porcenta9e glo2al

No Des

Pronosticado El respeto es importante4 Porcenta9e No Des correcto , #% @, , +$ $,,@, ')@*

a4 En el modelo se incluGe una constante4 24 El valor de corte es @',,

3o <ay nin&una persona ;ue <aya contestado 35. e <an clasificado como si todos contestaran I. 'sto es por;ue es el paso previo o paso inicial. !11S clasificados a I IJ.

Variables en la e$ a$in Paso , Constante > @(+* E4T4 @#+( Lald #@,(& gl $ Sig4 @$'+ EAp->. $@+$+

%aso 1 por;ue solo consideramos el valor constante. 3o consideramos variables predictoras. 'l coeficiente de Xald: tiene un &rado de si&. 1.!54. 'l modelo no tiene si&nificacin estad.stica. i el nivel de si&nificacin en el blo;ue 1 es si&nificativo: entonces el modelo no vale: ya ;ue <ay un ses&o en los datos. i el nivel de si&nificacin nos saliera !:111 tambi#n tendr.amos ;ue preocuparnos: ya ;ue probablemente eCistir.a ses&o. 7a si&uiente Tabla es importante9
Variables K e no est5n en la e$ a$in Paso , Caria2les EDAD N?RESP EDAD 2G N?RESP Puntuacin #*@,)* #+@*$& #&@&&) (*@$$$ gl $ $ $ ( Sig4 @,,, @,,, @,,, @,,,

EstadJsticos glo2ales

on las variables no incluidas en la ecuacin. 7a puntuacin es la de la "<iAcuadrado: pero lo ms importante es la si&nificacin. 3o salen si&nificativos: todas podr.an incluirse en la ecuacin: pero aun no estn incluidas. 'n el si&uiente blo;ue meteremos todas las variables: para ver si el modelo predice correctamente.

BloK e (B MLtodo M Introd $ir


%r ebas omnib s sobre los $oe,i$ientes del modelo Paso $ Paso >loMue Modelo C8i/cuadrado +#@)%# +#@)%# +#@)%# gl ( ( ( Sig4 @,,, @,,, @,,,

=ay tres l.neas -%aso: 8lo;ue: Modelo/. 'sto si&nifica distintos m#todos de estimacin. "omo nosotros <emos realiBado la estimacin con(unta: solo observaremos la >ltima fila IModeloJ con las variables predictoras. -%aso seria estimacin por pasosR 8lo;ue seria estimacin por 8lo;ue. 3o la estudiaremos este ao/ 'l modelo tiene contribucin si&nificativa - i&. E 1:111/
Res men de los modelos /# log de la R cuadrado verosimilitud de CoA G Snell '#@,)$ a @+') R cuadrado de Nagel3er3e @*$&

Paso $

a4 La estimacin 8a !inali=ado en el n"mero de iteracin * porMue las estimaciones de los parmetros 8an cam2iado en menos de @,,$4

0 37 -A0 lo& de la verosimilitud indica el nivel de a(uste &lobal/ 3os fi(aremos en el valor de el 4 cuadrado de 3a&elOerOe.6ar.a entre 1 y !: como vale 1g*!+: parece ;ue el valor esta bien. 's anlo&o al coeficiente de determinacin de la re&resin m>ltiple. -'s el me(or .ndice para ver/

%r eba de Dosmer . LemesEoF Paso $ C8i/cuadrado *@('& gl ) Sig4 @*,&

's una prueba de la "<i cuadrado: fundamentalmente. =a salido 1:*1+. 'so esta bien: ya ;ue <a salido no si&nificativo. 'sta prueba tiene ;ue ser no si&nificativa: ya ;ue <ay ;ue aceptar la <iptesis nula de ;ue fenmeno real y modelo predic<o son i&uales. i sale si&nificativo <ay ;ue rec<aBar la <iptesis nula.
Tabla de $ontin6en$ias /ara la /r eba de Dosmer . LemesEoF El respeto es importante4 : No ?2servado Esperado & *@'#* & *@#'% ' '@&), ( +@+&& + #@)&( # $@',% , @)*$ $ @+$+ , @#$( , @,)& El respeto es importante4 : Des ?2servado Esperado , @+&+ , @&+$ # $@##, + #@'#( + '@$#& ' '@+%$ & *@$(% * *@')* & *@&)& * '@%$(

Total & & & & ) & & & & *

Paso $

$ # ( + ' * & ) % $,

'n este caso no tiene importancia la tabla de contin&encias para la prueba de =osmer y 7emes<o`
a Tabla de $lasi,i$a$in

Paso $

?2servado El respeto es importante4 Porcenta9e glo2al

No Des

Pronosticado El respeto es importante4 Porcenta9e No Des correcto ## & &'@% ' (* )&@) )#@%

a4 El valor de corte es @',,

4ecordemos ;ue en el Anlisis Discriminante usamos el mismo concepto -MatriB de confusin/. 'l ob(etivo es el mismo: pero teniendo variable dicotmica.

Variables en la e$ a$in Paso a $ EDAD N?RESP EDAD 2G N?RESP Constante > @$,* (@(#+ /@,#) /'@+$+ E4T4 @,+$ #@()& @,'+ $@&&' Lald *@&(( $@%(% @#') %@(,) gl $ $ $ $ Sig4 @,,% @$*+ @*$$ @,,# EAp->. $@$$# #&@&*& @%&( @,,+

a4 Caria2le-s. introducida-s. en el paso $0 EDAD@ N?RESP@ EDAD N N?RESP 4

"on esta tabla podemos decir ;ue la variable edad <a salido si&nificativa: mientras ;ue la tercera variable: no respeto: no tiene si&nificacin estad.stica. Tanto la interaccin edad con la tercera variable. %or tanto podemos concluir ;ue solo podemos incluir la variable edad en la ecuacin.
b Listado /or $asos

Caso *,

Estado de a seleccin S

?2servado El respeto es importante4 NNN

Caria2le temporal Pronosticado @%+* rupo pronosticado D Resid /@%+* VResid /+@$&'

a4 S : Seleccionados@ N : Casos no seleccionados G NN : Casos mal clasi!icados4 24 Se listan los casos con residuos estudenti=ados maGores Mue #@,,,4

6amos a predecir si el individuo es fumador o fumadora en funcin de otras variables

E3ercicio R 1. (undo emplear)a la 4 en lugar del 2D? (ules son las venta6as " desventa6as de esta decisin? 2. (ul es la medida global del nivel de a6uste del modelo logit? (mo se eval8a? 3. .n la 4! cmo se mide la significacin estad)stica para cada coeficiente estimado de la ecuacin? '. Define los siguientes trminos " e#plica para qu sirven en el proceso del anlisis de los resultados$ el valor de Wosmer " 4ames,oX " la Y de -agelOerOe.

+. Cundo emplear(a la #6 en lugar del AD" desventa-as de esta decisin"

Cules son las venta-as %

7a 47 se puede usar en veB del AD cuando no cumple la linealidad: pero la ms importante es cuando tenemos una variable dicotmica como variable dependiente: ya ;ue muc<as veces no se cumple la linealidad. 'l AD es apropiado cuando la variable dependiente es no m#trica. in embar&o: cuando la variable dependiente tiene slo dos &rupos: puede ser preferible la 47 por los si&uientes motivos. !. no se cumplen los supuestos de normalidad multivariante: la linealidad y la i&ualdad de matrices de varianBaAcovarianBa entre &rupos. 0. los resultados obtenidos son muy parecida a los de la re&resin m>ltiple y cuenta con contrastes estad.sticos directos: por lo ;ue eCiste la capacidad para incorporar efectos no lineales y permitir una amplia variedad de dia&nsticos. $. eCiste una variable dicotmica como variable dependiente

/. Cul es la medida global del nivel de a-uste del modelo logit" Cmo se eval3a" 'l t#rmino modelo de lo&it es el mismo ;ue la re&resin lo&.stica. 7a medida &lobal de la 47 viene dada por el valor de la verosimilitud: ;ue se representa por A0 77 -A0 veces el lo&aritmo de la verosimilitud/. Mn modelo con un buen a(uste tendr un valor pe;ueo: siendo el valor m.nimo de A077 cero -un a(uste perfecto/: cuanto mayor sea el valor peor es el a(uste.

0. ,n la #6$ cmo se mide la significacin estad(stica para cada coeficiente estimado de la ecuacin" 'n la re&resin m>ltiple: el valor de la t se utiliBa para valorar la si&nificatividad de cada coeficiente. 7a 47 utiliBa un estad.stico diferente: el estad.stico de Xald: ;ue proporciona la si&nificacin estad.stica para cada coeficiente estimado de tal forma ;ue se puede contrastar la <iptesis de ;ue un coeficiente sea distinto de cero. i el valor de Xald es estad.sticamente si&nificativo: se incluye dic<o coeficiente en la ecuacin: y si no: se eCcluye.

'. Define los siguientes t!rminos % e&plica para u! sirven en el proceso del anlisis de los resultados: el valor de Kosmer % 6ames*oM % la #N de AagelIerIe. !. 6alor de =osmer y 7ames<o`9 mide la correspondencia de los valores reales y predic<os de la variable dependiente: y se eCpresa con el valor de c<iAcuadrado. %or ello: un valor c<iAcuadrado no si&nificativo indica un buen a(uste del modelo. Tiene ;ue salir no si&nificativo por;ue la <iptesis nula es ;ue son i&uales y no ;ueremos rec<aBarla. 0. 4h de 3a&elOerOe9 es comparable con el coeficiente de determinacin de la 4M ;ue indica con los mayores valores un me(or a(uste del modelo. 6ar.a entre 1 y !.

4. Interpreta la siguiente tabla:


Tabla de $lasi,i$a$in2a3 ?2servado 5$ $ Paso $ 5$ Porcenta9e glo2al a El valor de corte es @',, $ # #') $$+ # &% $*$ Pronosticado Porcenta9e correcto &*@* ')@' *)@'

's anlo&a a la matriB de confusin del anlisis discriminante. 'sta tabla de clasificacin indica cmo de bien se predice la pertenencia a los &rupos. e&>n la informacin de la tabla: el modelo lo&ia correctamente clasifica 05, <ombres: pero errneamente +9 <ombres: por lo tanto un +*:*S de los casos son correctamente clasificados. 4especto a las

mu(eres: el modelo clasifica !*! casos pero errneamente !!4 casos: por ello: la tasa de clasificacin correcta para las mu(eres es un 5,:5S. Desde una perspectiva &lobal: un *,:5S de todos los casos estn correctamente clasificados.

También podría gustarte