Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Análisis Multivariable - Conceptos Basicos PDF
El Análisis Multivariable - Conceptos Basicos PDF
conceptos básicos
Universitat de València
Dpto. de Dirección de Empresas “Juan José Renau Piqueras”
1
Estas notas son una selección de aquellos textos que, bajo mi punto de vista, mejor abordan
el tema analizado. Sus autores aparecen citados al principio de cada epígrafe, y a ellos hay
que referirse cuando se citen los contenidos de estas notas. Mi única tarea ha sido la de selec-
cionar, ordenar y, en algunos casos traducir los textos originales.
2 Análisis multivariable: conceptos básicos
Joaquín Aldás Manzano
2. Conceptos básicos
Escalas de medida
(Manzano, 1995; Uriel, 1995)
Arcias Centígrados
80 180
60 160
40 140
20 120
0 100
-20 80
La inferencia estadística
(Manzano, 1995)
DEPENDENCIA:
Predicción de
variables dependientes
por otras
independientes
Cuántas relaciones
se miden
Métrica No Métrica
Análisis
Correlación multivariable de
canónica varianza
INTERDEPENDENCIA:
Identificar la
estructura de
interrelaciones
La estructura de
relaciones en entre:
Casos/
Variables Objetos
Respuestas
B Métrica No Métrica
C
No Métrica
Escalamiento Análisis de
multidimensional correspondencias
Regresión múltiple
Análisis de variable
discriminante dependiente
limitada
LEYENDA
Punto de decisión
Decisión tomada
Técnica seleccionada
Correlación canónica
Y1 +Y2 +Y3 +...+Yn = X1 +X2 +X3 +...+Xm
(métricas, no métricas) (métricas, no métricas)
Análisis de varianza
Y1 =X1 +X2 +X3 +...+Xm
(métrica) (no métricas)
Análisis conjunto
Y1 =X1 +X2 +X3 +...+Xm
(métrica, no métrica) (no métricas)
son los casos los que se agrupan para encontrar la relación subyacente se
recurre al análisis conjunto. Finalmente si el interés está en la estructura de los
objetos, debería aplicarse el escalamiento multidimensional.
Una vez recogidos los datos, es necesario conocer cuáles son las hipótesis en
que se basan las técnicas multivariables y, que si no se cumplen, hace que
carezca de sentido aplicarlas. En las técnicas de dependencia, por ejemplo,
suele ser necesario que los tados cumplan las hipótesis de normalidad, linea-
lidad, independencia del término de error y homoscedasticidad.
Antes de aceptar los resultados a los que haya llegado, debe aplicar una
serie de técnicas de diagnóstico que asegure que estos resultados son genera-
lizables al conjunto de la población.
De forma más detallada, las siete variables que miden la percepción que tienen
de HATCO sus clientes, son las siguientes:
1. X1: Rapidez del servicio. Tiempo que tarda en servirse el pedido una
vez que éste ha sido confirmado.
2. X2: Nivel de precios. Valoración sobre el precio que se carga respecto
a otros suministradores.
3. X3: Flexibilidad de precios. Voluntad de los vendedores de HATCO
de negociar el precio en todo tipo de compras.
4. X4: Imagen del fabricante. Imagen global de HATCO.
5. X5: Servicio. Valoración respecto a si la calidad actual del servicio es
suficiente para mantener la relación entre el comprador y HATCO.
13 Análisis multivariable: conceptos básicos
Joaquín Aldás Manzano
Todas estas variables se han medido mediante una escala gráfica constituida
por una línea de diez centímetros donde en los extremos aparecen las palabras
“muy mala” y “excelente”:
Normalidad
Es una de las hipótesis más importantes. Hace referencia al perfil que debe
mostrar la distribución de frecuencias de cada variable métrica
individualmente. Si este perfil se desvía de la distribución normal, cualquier
prueba estadística que llevemos a cabo no sería válida. La mayoría de las técni-
cas multivariables exigen, además, que las variables sean multivariablemente
normales, esto es, no sólo que individualmente tengan una distribución normal,
sino que las combinaciones de las mismas también posean esta forma.
dad multivariables son más complejas y suelen ser específicas de las técnicas
donde esta hipótesis es más necesaria. Serán analizadas al desarrollar esas
técnicas en concreto.
Variable 1
Variable 2
Variable 3
Variable 4
Distribuciones
Gráficos q-q
univariadas
EXAMINE
VARIABLES=x1 x2 x3 x4 x5 x6 x7 x9 x10
/PLOT BOXPLOT NPPLOT
/COMPARE GROUP
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
que nos proporciona la siguiente información más relevante. Como gráficos q-q
mostramos dos ejemplos correspondientes a las variables X1 (rapidez del servi-
cio) y X6 (imagen de la fuerza de ventas)
0
Normal esperado
-1
-2
-3
-1 0 1 2 3 4 5 6 7
Valor observado
18 Análisis multivariable: conceptos básicos
Joaquín Aldás Manzano
Normal esperado
-1
-2
-3
0 1 2 3 4 5
Valor observado
Pruebas de normalidad
Kolmogorov-Smirnova
Estadístico gl Sig.
Rapidez de servicio ,063 100 ,200*
nivel de precios ,095 100 ,028
flexibilidad de precios ,095 100 ,027
Imagen del fabricante ,107 100 ,007
Servicio ,085 100 ,069
Imagen de los
,122 100 ,001
vendedores
Calidad del producto ,091 100 ,041
Nivel de uso ,079 100 ,131
nivel de satisfacción ,078 100 ,142
*. Este es un límite inferior de la significación verdadera.
a. Corrección de la significación de Lilliefors
El test KSL plantea la hipótesis nula de que la variable se distribuye según una
normal, por lo que hay que comprobar si para alguna variable existe un valor p
inferior al nivel de significación que, como dijimos, podía ser 0,01 o 0,05. Si es
así, podremos rechazar para esa variable la hipótesis nula y, consecuentemente,
afirmar que esa variable no se distribuye según una normal. Puede observarse
en el cuadro 4 que las variables X4 “imagen del fabricante” (p=0,007) y X6
“imagen de los vendedores” (p=0,001) tienen valores de p inferiores a 0,01, por
lo que podremos concluir que no siguen una distribución normal. A la misma
conclusión podríamos haber llegado analizando el gráfico 1.4. En él se
comprueba como en la gráfica correspondiente a la variable X1 “rapidez del
19 Análisis multivariable: conceptos básicos
Joaquín Aldás Manzano
ìï x p p ¹ 0
T (x ) = ïí
ïï ln x
î
Homoscedasticidad
La segunda asunción que se hace sobre los datos, para poder aplicar las técni-
cas multivariables, hace referencia a la igualdad de varianza entre las variables
independientes, ya sean éstas métricas o no métricas, respecto a la variable o
variables dependientes. SPSS proporciona un test específico para analizar esta
hipótesis, el test de Levene, cuya hipótesis nula es la homoscedasticidad, es
decir, que las varianzas son iguales. En nuestro ejemplo, habría que realizar
esta prueba de homoscedasticidad para el conjunto de variables independientes
(X1, X2, X3, X4, X5, X6, X7, X9 y X10), con respecto a las posibles variables
dependientes que, como se señaló en el cuadro 3, pueden ser las variables (X8,
X11, X12, X13 y X14). La sintaxis par obtener este test en SPSS, sería la
siguiente:
20 Análisis multivariable: conceptos básicos
Joaquín Aldás Manzano
EXAMINE
VARIABLES= x1 x2 x3 x4 x5 x6 x9 x10 x7 BY x8
x11 x12 x13 x14
/PLOT SPREADLEVEL
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Puede comprobarse que, tomando como nivel de significación 0,05, los valores
p correspondientes a X4 “imagen del fabricante” (p=0,012), X5 “servicio”
(p=0,006), X6 “imagen de los vendedores” (p=0.024) y X7 “Calidad del
producto” (p=0,004) permiten rechazar la hipótesis nula de homoscedasticidad
y, por ello, será necesario realizar transformaciones análogas a las que llevába-
mos a cabo para conseguir la normalidad, con el fin de poder aplicar muchas
de las técnicas multivariables que analizaremos.
21 Análisis multivariable: conceptos básicos
Joaquín Aldás Manzano
Estadístico
de Levene gl1 gl2 Sig.
Rapidez de servicio Basándose en la media ,934 1 98 ,336
Basándose en la
,993 1 98 ,321
mediana.
Basándose en la
mediana y con gl ,993 1 92,885 ,322
corregido
Basándose en la media
,934 1 98 ,336
recortada
nivel de precios Basándose en la media 1,582 1 98 ,211
Basándose en la
1,668 1 98 ,200
mediana.
Basándose en la
mediana y con gl 1,668 1 97,938 ,200
corregido
Basándose en la media
1,685 1 98 ,197
recortada
flexibilidad de precios Basándose en la media 1,194 1 98 ,277
Basándose en la
,749 1 98 ,389
mediana.
Basándose en la
mediana y con gl ,749 1 85,351 ,389
corregido
Basándose en la media
,817 1 98 ,368
recortada
Imagen del fabricante Basándose en la media 6,549 1 98 ,012
Basándose en la
3,960 1 98 ,049
mediana.
Basándose en la
mediana y con gl 3,960 1 79,356 ,050
corregido
Basándose en la media
6,353 1 98 ,013
recortada
Servicio Basándose en la media 7,819 1 98 ,006
Basándose en la
6,741 1 98 ,011
mediana.
Basándose en la
mediana y con gl 6,741 1 83,075 ,011
corregido
Basándose en la media
7,932 1 98 ,006
recortada
Imagen de los Basándose en la media 5,241 1 98 ,024
vendedores Basándose en la
4,604 1 98 ,034
mediana.
Basándose en la
mediana y con gl 4,604 1 93,255 ,034
corregido
Basándose en la media
4,977 1 98 ,028
recortada
Nivel de uso Basándose en la media 1,377 1 98 ,243
Basándose en la
1,305 1 98 ,256
mediana.
Basándose en la
mediana y con gl 1,305 1 97,893 ,256
corregido
Basándose en la media
1,325 1 98 ,252
recortada
nivel de satisfacción Basándose en la media ,323 1 98 ,571
Basándose en la
,194 1 98 ,660
mediana.
Basándose en la
mediana y con gl ,194 1 97,681 ,660
corregido
Basándose en la media
,303 1 98 ,584
recortada
Calidad del producto Basándose en la media 8,748 1 98 ,004
Basándose en la
mediana. 9,178 1 98 ,003
Basándose en la
mediana y con gl 9,178 1 97,298 ,003
corregido
Basándose en la media
8,811 1 98 ,004
recortada
Linealidad
GRAPH
/SCATTERPLOT(MATRIX)=x1 x4 x6
/MISSING=LISTWISE .
CORRELATIONS
/VARIABLES=x1 x2 x3 x4 x5 x6 x7 x9 x10
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
donde sólo se pide, a modo de ejemplo, que se realicen los gráficos de dispersión
entre las variables X1 “rapidez del servicio”, X4 “imagen del fabricante” y X6
“imagen de los vendedores”. A simple vista se observa que no parece que exista
una relación lineal entre la rapidez del servicio y la imagen de los fabricantes,
pero sí y bastante marcada, entre la imagen de los fabricantes y la de los
vendedores.
Rapidez de servicio
Imagen de Calidad
Rapidez de nivel de flexibilidad Imagen del los del Nivel de nivel de
servicio precios de precios fabricante Servicio vendedores producto uso satisfacción
Rapidez de servicio Correlación de Pearson
Sig. (bilateral)
N
nivel de precios Correlación de Pearson -,349**
Sig. (bilateral) ,000
N 100
flexibilidad de precios Correlación de Pearson ,509** -,487 **
Sig. (bilateral) ,000 ,000
N 100 100
Imagen del fabricante Correlación de Pearson ,050 ,272 ** -,116
Sig. (bilateral) ,618 ,006 ,250
N 100 100 100
Servicio Correlación de Pearson ,612** ,513 ** ,067 ,299**
Sig. (bilateral) ,000 ,000 ,510 ,003
N 100 100 100 100
Imagen de los Correlación de Pearson ,077 ,185 -,035 ,788** ,240*
vendedores Sig. (bilateral) ,444 ,065 ,731 ,000 ,016
N 100 100 100 100 100
Calidad del producto Correlación de Pearson -,483** ,470 ** -,448** ,200* -,055 ,177
Sig. (bilateral) ,000 ,000 ,000 ,046 ,586 ,079
N 100 100 100 100 100 100
Nivel de uso Correlación de Pearson ,676** ,082 ,559** ,224* ,701** ,255* -,192
Sig. (bilateral) ,000 ,418 ,000 ,025 ,000 ,010 ,055
N 100 100 100 100 100 100 100
nivel de satisfacción Correlación de Pearson ,651** ,028 ,525** ,476** ,631** ,341** -,283 ** ,711**
Sig. (bilateral) ,000 ,779 ,000 ,000 ,000 ,001 ,004 ,000
N 100 100 100 100 100 100 100 100
**. La correlación es significativa al nivel 0,01 (bilateral).
*. La correlación es significante al nivel 0,05 (bilateral).
Referencias bibliográficas