Documentos de Académico
Documentos de Profesional
Documentos de Cultura
conceptos bsicos
Universitat de Valncia
Dpto. de Direccin de Empresas Juan Jos Renau Piqueras
1
Estas notas son una seleccin de aquellos textos que, bajo mi punto de vista, mejor abordan
el tema analizado. Sus autores aparecen citados al principio de cada epgrafe, y a ellos hay
que referirse cuando se citen los contenidos de estas notas. Mi nica tarea ha sido la de selec-
cionar, ordenar y, en algunos casos traducir los textos originales.
2 Anlisis multivariable: conceptos bsicos
Joaqun Alds Manzano
1. Qu es el anlisis multivariable?
(Hair, Anderson, Tatham y Black, 1995)
2. Conceptos bsicos
Escalas de medida
(Manzano, 1995; Uriel, 1995)
Arcias Centgrados
80 180
60 160
40 140
20 120
0 100
-20 80
La inferencia estadstica
(Manzano, 1995)
DEPENDENCIA:
Prediccin de
variables dependientes
por otras
independientes
Cuntas relaciones
se miden
Mtrica No Mtrica
Anlisis
Correlacin multivariable de
cannica varianza
INTERDEPENDENCIA:
Identificar la
estructura de
interrelaciones
La estructura de
relaciones en entre:
Casos/
Variables Objetos
Respuestas
B Mtrica No Mtrica
C
No Mtrica
Escalamiento Anlisis de
multidimensional correspondencias
Regresin mltiple
Anlisis de variable
discriminante dependiente
limitada
LEYENDA
Punto de decisin
Decisin tomada
Tcnica seleccionada
Correlacin cannica
Y1 +Y2 +Y3 +...+Yn = X1 +X2 +X3 +...+Xm
(mtricas, no mtricas) (mtricas, no mtricas)
Anlisis de varianza
Y1 =X1 +X2 +X3 +...+Xm
(mtrica) (no mtricas)
Anlisis conjunto
Y1 =X1 +X2 +X3 +...+Xm
(mtrica, no mtrica) (no mtricas)
son los casos los que se agrupan para encontrar la relacin subyacente se
recurre al anlisis conjunto. Finalmente si el inters est en la estructura de los
objetos, debera aplicarse el escalamiento multidimensional.
Una vez recogidos los datos, es necesario conocer cules son las hiptesis en
que se basan las tcnicas multivariables y, que si no se cumplen, hace que
carezca de sentido aplicarlas. En las tcnicas de dependencia, por ejemplo,
suele ser necesario que los tados cumplan las hiptesis de normalidad, linea-
lidad, independencia del trmino de error y homoscedasticidad.
Antes de aceptar los resultados a los que haya llegado, debe aplicar una
serie de tcnicas de diagnstico que asegure que estos resultados son genera-
lizables al conjunto de la poblacin.
De forma ms detallada, las siete variables que miden la percepcin que tienen
de HATCO sus clientes, son las siguientes:
1. X1: Rapidez del servicio. Tiempo que tarda en servirse el pedido una
vez que ste ha sido confirmado.
2. X2: Nivel de precios. Valoracin sobre el precio que se carga respecto
a otros suministradores.
3. X3: Flexibilidad de precios. Voluntad de los vendedores de HATCO
de negociar el precio en todo tipo de compras.
4. X4: Imagen del fabricante. Imagen global de HATCO.
5. X5: Servicio. Valoracin respecto a si la calidad actual del servicio es
suficiente para mantener la relacin entre el comprador y HATCO.
13 Anlisis multivariable: conceptos bsicos
Joaqun Alds Manzano
Todas estas variables se han medido mediante una escala grfica constituida
por una lnea de diez centmetros donde en los extremos aparecen las palabras
muy mala y excelente:
Normalidad
Variable 1
Variable 2
Variable 3
Variable 4
Distribuciones
Grficos q-q
univariadas
EXAMINE
VARIABLES=x1 x2 x3 x4 x5 x6 x7 x9 x10
/PLOT BOXPLOT NPPLOT
/COMPARE GROUP
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
0
Normal esperado
-1
-2
-3
-1 0 1 2 3 4 5 6 7
Valor observado
18 Anlisis multivariable: conceptos bsicos
Joaqun Alds Manzano
Normal esperado
-1
-2
-3
0 1 2 3 4 5
Valor observado
Pruebas de normalidad
Kolmogorov-Smirnova
Estadstico gl Sig.
Rapidez de servicio ,063 100 ,200*
nivel de precios ,095 100 ,028
flexibilidad de precios ,095 100 ,027
Imagen del fabricante ,107 100 ,007
Servicio ,085 100 ,069
Imagen de los
,122 100 ,001
vendedores
Calidad del producto ,091 100 ,041
Nivel de uso ,079 100 ,131
nivel de satisfaccin ,078 100 ,142
*. Este es un lmite inferior de la significacin verdadera.
a. Correccin de la significacin de Lilliefors
El test KSL plantea la hiptesis nula de que la variable se distribuye segn una
normal, por lo que hay que comprobar si para alguna variable existe un valor p
inferior al nivel de significacin que, como dijimos, poda ser 0,01 o 0,05. Si es
as, podremos rechazar para esa variable la hiptesis nula y, consecuentemente,
afirmar que esa variable no se distribuye segn una normal. Puede observarse
en el cuadro 4 que las variables X4 imagen del fabricante (p=0,007) y X6
imagen de los vendedores (p=0,001) tienen valores de p inferiores a 0,01, por
lo que podremos concluir que no siguen una distribucin normal. A la misma
conclusin podramos haber llegado analizando el grfico 1.4. En l se
comprueba como en la grfica correspondiente a la variable X1 rapidez del
19 Anlisis multivariable: conceptos bsicos
Joaqun Alds Manzano
x p p 0
T (x ) =
ln x
Homoscedasticidad
La segunda asuncin que se hace sobre los datos, para poder aplicar las tcni-
cas multivariables, hace referencia a la igualdad de varianza entre las variables
independientes, ya sean stas mtricas o no mtricas, respecto a la variable o
variables dependientes. SPSS proporciona un test especfico para analizar esta
hiptesis, el test de Levene, cuya hiptesis nula es la homoscedasticidad, es
decir, que las varianzas son iguales. En nuestro ejemplo, habra que realizar
esta prueba de homoscedasticidad para el conjunto de variables independientes
(X1, X2, X3, X4, X5, X6, X7, X9 y X10), con respecto a las posibles variables
dependientes que, como se seal en el cuadro 3, pueden ser las variables (X8,
X11, X12, X13 y X14). La sintaxis par obtener este test en SPSS, sera la
siguiente:
20 Anlisis multivariable: conceptos bsicos
Joaqun Alds Manzano
EXAMINE
VARIABLES= x1 x2 x3 x4 x5 x6 x9 x10 x7 BY x8
x11 x12 x13 x14
/PLOT SPREADLEVEL
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Puede comprobarse que, tomando como nivel de significacin 0,05, los valores
p correspondientes a X4 imagen del fabricante (p=0,012), X5 servicio
(p=0,006), X6 imagen de los vendedores (p=0.024) y X7 Calidad del
producto (p=0,004) permiten rechazar la hiptesis nula de homoscedasticidad
y, por ello, ser necesario realizar transformaciones anlogas a las que llevba-
mos a cabo para conseguir la normalidad, con el fin de poder aplicar muchas
de las tcnicas multivariables que analizaremos.
21 Anlisis multivariable: conceptos bsicos
Joaqun Alds Manzano
Estadstico
de Levene gl1 gl2 Sig.
Rapidez de servicio Basndose en la media ,934 1 98 ,336
Basndose en la
,993 1 98 ,321
mediana.
Basndose en la
mediana y con gl ,993 1 92,885 ,322
corregido
Basndose en la media
,934 1 98 ,336
recortada
nivel de precios Basndose en la media 1,582 1 98 ,211
Basndose en la
1,668 1 98 ,200
mediana.
Basndose en la
mediana y con gl 1,668 1 97,938 ,200
corregido
Basndose en la media
1,685 1 98 ,197
recortada
flexibilidad de precios Basndose en la media 1,194 1 98 ,277
Basndose en la
,749 1 98 ,389
mediana.
Basndose en la
mediana y con gl ,749 1 85,351 ,389
corregido
Basndose en la media
,817 1 98 ,368
recortada
Imagen del fabricante Basndose en la media 6,549 1 98 ,012
Basndose en la
3,960 1 98 ,049
mediana.
Basndose en la
mediana y con gl 3,960 1 79,356 ,050
corregido
Basndose en la media
6,353 1 98 ,013
recortada
Servicio Basndose en la media 7,819 1 98 ,006
Basndose en la
6,741 1 98 ,011
mediana.
Basndose en la
mediana y con gl 6,741 1 83,075 ,011
corregido
Basndose en la media
7,932 1 98 ,006
recortada
Imagen de los Basndose en la media 5,241 1 98 ,024
vendedores Basndose en la
4,604 1 98 ,034
mediana.
Basndose en la
mediana y con gl 4,604 1 93,255 ,034
corregido
Basndose en la media
4,977 1 98 ,028
recortada
Nivel de uso Basndose en la media 1,377 1 98 ,243
Basndose en la
1,305 1 98 ,256
mediana.
Basndose en la
mediana y con gl 1,305 1 97,893 ,256
corregido
Basndose en la media
1,325 1 98 ,252
recortada
nivel de satisfaccin Basndose en la media ,323 1 98 ,571
Basndose en la
,194 1 98 ,660
mediana.
Basndose en la
mediana y con gl ,194 1 97,681 ,660
corregido
Basndose en la media
,303 1 98 ,584
recortada
Calidad del producto Basndose en la media 8,748 1 98 ,004
Basndose en la
mediana. 9,178 1 98 ,003
Basndose en la
mediana y con gl 9,178 1 97,298 ,003
corregido
Basndose en la media
8,811 1 98 ,004
recortada
Linealidad
GRAPH
/SCATTERPLOT(MATRIX)=x1 x4 x6
/MISSING=LISTWISE .
CORRELATIONS
/VARIABLES=x1 x2 x3 x4 x5 x6 x7 x9 x10
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
donde slo se pide, a modo de ejemplo, que se realicen los grficos de dispersin
entre las variables X1 rapidez del servicio, X4 imagen del fabricante y X6
imagen de los vendedores. A simple vista se observa que no parece que exista
una relacin lineal entre la rapidez del servicio y la imagen de los fabricantes,
pero s y bastante marcada, entre la imagen de los fabricantes y la de los
vendedores.
Rapidez de servicio
Imagen de Calidad
Rapidez de nivel de flexibilidad Imagen del los del Nivel de nivel de
servicio precios de precios fabricante Servicio vendedores producto uso satisfaccin
Rapidez de servicio Correlacin de Pearson
Sig. (bilateral)
N
nivel de precios Correlacin de Pearson -,349**
Sig. (bilateral) ,000
N 100
flexibilidad de precios Correlacin de Pearson ,509** -,487 **
Sig. (bilateral) ,000 ,000
N 100 100
Imagen del fabricante Correlacin de Pearson ,050 ,272 ** -,116
Sig. (bilateral) ,618 ,006 ,250
N 100 100 100
Servicio Correlacin de Pearson ,612** ,513 ** ,067 ,299**
Sig. (bilateral) ,000 ,000 ,510 ,003
N 100 100 100 100
Imagen de los Correlacin de Pearson ,077 ,185 -,035 ,788** ,240*
vendedores Sig. (bilateral) ,444 ,065 ,731 ,000 ,016
N 100 100 100 100 100
Calidad del producto Correlacin de Pearson -,483** ,470 ** -,448** ,200* -,055 ,177
Sig. (bilateral) ,000 ,000 ,000 ,046 ,586 ,079
N 100 100 100 100 100 100
Nivel de uso Correlacin de Pearson ,676** ,082 ,559** ,224* ,701** ,255* -,192
Sig. (bilateral) ,000 ,418 ,000 ,025 ,000 ,010 ,055
N 100 100 100 100 100 100 100
nivel de satisfaccin Correlacin de Pearson ,651** ,028 ,525** ,476** ,631** ,341** -,283 ** ,711**
Sig. (bilateral) ,000 ,779 ,000 ,000 ,000 ,001 ,004 ,000
N 100 100 100 100 100 100 100 100
**. La correlacin es significativa al nivel 0,01 (bilateral).
*. La correlacin es significante al nivel 0,05 (bilateral).
Referencias bibliogrficas