Documentos de Académico
Documentos de Profesional
Documentos de Cultura
4/d/yyyy
Anlisis Multivariable
Resumen
El procedimiento Anlisis Multivariable est diseado para resumir dos columnas o ms de
datos numricos. Calcula estadsticos de resumen para cada variable, as como las varianzas y
correlaciones entre las variables. Las grficas incluyen una matriz de dispersin, grficas de
estrella y de rayos. Este procedimiento es usado frecuentemente antes de construir un modelo de
regresin mltiple.
Model
(Modelo)
MPG
City
(MPG
Ciudad)
Acura
Integra
25
Acura
Legend
18
Audi
90
20
Audi
100
19
BMW
535i
22
Buick
Century
22
Buick
LeSabre
19
Buick
Roadmaster 16
Buick
Riviera
19
Cadillac
DeVille
16
Cadillac
Seville
16
Chevrolet Cavalier
25
Chevrolet Corsica
25
Chevrolet Camaro
19
Chevrolet Lumina
21
Chevrolet Lumina_A 18
PV
Chevrolet Astro
15
Chevrolet Caprice
17
Chevrolet Corvette
17
Chrylser Concorde
20
MPG
Highway
(MPG
Carretera)
31
25
26
26
30
31
28
25
27
25
25
36
34
28
29
23
Engine
Size
(Tamao
deMotor)
1.8
3.2
2.8
2.8
3.5
2.2
3.8
5.7
3.8
4.9
4.6
2.2
2.2
3.4
2.2
3.8
Hors
(Caballos
de Fuerza)
RPM
140
200
172
172
208
110
170
180
170
200
295
110
110
160
110
170
6300
5500
5500
5500
5700
5200
4800
4000
4800
4100
6000
5200
5200
4600
5200
4800
Fueltank
(Tanque
de
comb)
13.2
18
16.9
21.1
21.1
16.4
18
23
18.8
18
20
15.2
15.6
15.5
16.5
20
20
26
25
28
4.3
5.0
5.7
3.3
165
170
300
153
4000
4200
5000
5300
27
23
20
18
Entrada de Datos
Los datos a analizar consisten en dos columnas numricas o ms.
A menos que se cambien las Opciones de Anlisis, slo se incluirn en el anlisis filas que
contengan informacin completa de todas las variables. En los datos muestra, hay n = 93
automviles con informacin completa de las k = 10 variables listadas.
2006 por StatPoint, Inc.
Opciones de Anlisis
Slo Casos Completos: excluye de todas las grficas y estadsticos cualquier fila en la que
una o ms de las columnas de datos de entrada contengan datos faltantes.
Matriz de Dispersiones
La Matriz de Dispersiones crea una matriz de dispersiones divariadas para todos los pares de
variables de Opciones de Anlisis.
MPG City
MPG Highway
Engine Size
Horsepower
RPM
Fueltank
Length
Wheelbase
Width
Weight
Ahora es ms fcil juzgar las relaciones que existen entre las variables.
Estadsticos de Resumen
El panel Estadsticos de Resumen calcula un nmero de diversos estadsticos que se usan
comnmente para resumir una muestra de n observaciones:
Resumen Estadstico
MPG
Ciudad
Recuento
93
Promedio
22.3656
Desviacin Estndar
5.61981
Coeficiente de Variacin 25.127%
Mnimo
15.0
Mximo
46.0
Rango
31.0
Rango Intercuartlico
7.0
Sesgo Estndar
6.71035
Curtosis Estndar
7.88248
Caballos de
fuerza
93
143.828
52.3744
36.4146%
55.0
300.0
245.0
67.0
3.74696
2.18677
RPM
93
5280.65
596.732
11.3004%
3800.0
6500.0
2700.0
950.0
-1.01784
-0.80606
Tanque de
comb.
93
16.6645
3.27937
19.6788%
9.2
27.0
17.8
4.3
0.425772
0.250406
Longitud
93
183.204
14.6024
7.97055%
141.0
219.0
78.0
18.0
-0.354703
0.88435
Panel de Opciones
Intervalos de Confianza
El panel Intervalos de Confianza despliega los intervalos de confianza de la media y del
desviacin estndar de cada variable.
Intervalos de confianza del 95.0%
Media
Error Est.
MPG Ciudad
22.3656
0.582747
MPG Carretera
29.086
0.552874
Tamao de motor 2.66774
0.10757
Caballos de fuerza 143.828
5.43097
RPM
5280.65
61.8782
Tanque de comb. 16.6645
0.340055
Longitud
183.204
1.5142
Wheelbase
103.946
0.707167
Ancho
69.3763
0.391863
Altura
3072.9
61.1694
Lmite Inferior
21.2082
27.988
2.4541
133.042
5157.75
15.9891
180.197
102.542
68.5981
2951.42
Lmite Superior
23.523
30.1841
2.88138
154.614
5403.54
17.3399
186.212
105.351
70.1546
3194.39
Lmite Inferior
4.91195
4.66015
0.906698
45.7774
521.568
2.8663
12.7631
5.96067
3.30299
515.594
Lmite Superior
6.56794
6.23125
1.21238
61.2106
697.407
3.83264
17.066
7.97023
4.41654
689.419
Se construyen intervalos de confianza del 95% del tal modo que, en muestreo repetido, el 95%
de tales intervalos contendrn el verdadero valor del parmetro a estimar. Tambin puede ver un
intervalo de confianza al especificar el margen de error del mismo modo como se establece al
tomar una encuesta de opinin. Por ejemplo, el intervalo de confianza para las millas por galn
promedio al conducir en ciudad va de 21.2 a 23.5.
Panel de Opciones
Correlaciones
Los coeficientes de correlacin miden la fuerza de la relacin lineal entre dos columnas en una
escala de 1 a +1. Entre mayor sea el valor absoluto de la correlacin, ms fuerte es la relacin
lineal entre las dos variables. STATGRAPHICS presenta los coeficientes de correlacin como
una matriz, de la cual se muestra una seccin a continuacin:
Correlaciones
MPG
Ciudad
MPG Ciudad
MPG
Carretera
0.9439
(93)
0.0000
-0.6268
(93)
0.0000
-0.6190
Inc.
(93)
0.0000
0.3135
(93)
Tamao
de motor
-0.7100
(93)
0.0000
-0.6268
(93)
0.0000
Caballos de
fuerza
-0.6726
(93)
0.0000
-0.6190
(93)
0.0000
0.7321
Correlacin
(93)
0.0000
0.7321
(93)
0.0000
-0.5479
(93)
0.0367
(93)
RPM
0.3630
(93)
0.0003
0.3135
(93)
0.0022
-0.5479
Tanque de
comb.
-0.8131
(93)
0.0000
-0.7860
(93)
0.0000
0.7593
Longitud
-0.6662
(93)
0.0000
-0.5429
(93)
0.0000
0.7803
(93)
0.0000
0.0367
(93)
0.0000
0.7118
(93)
0.0000
0.5509
(93)
0.7270
(93)
0.0000
-0.3333
(93)
Multiple
Variable Analysis - 6
(93)
0.0000
-0.4412
(93)
0.9359
(93)
0.0000
Tamao de motor -0.8212
(Tamao de Muestra)(93)
0.0000
Valor-P
Caballos de fuerza -0.7893
(93)
0.0000
RPM
0.3896
(93)
0.0002
Tanque de comb. -0.8836
(93)
0.0000
Longitud
-0.6624
(93)
0.0000
Wheelbase
-0.7148
(93)
0.0000
Ancho
-0.8104
(93)
0.0000
Peso
-0.8928
(93)
0.0000
0.9359
(93)
0.0000
MPG Carretera
-0.7257
(93)
0.0000
-0.7100
(93)
0.0000
0.3156
(93)
0.0025
-0.8389
(93)
0.0000
-0.5473
(93)
0.0000
-0.6315
(93)
0.0000
-0.6896
(93)
0.0000
-0.8382
(93)
0.0000
Tamao de
motor
-0.8212
(93)
0.0000
-0.7257
(93)
0.0000
Correlacin
0.8142
(93)
0.0000
-0.5295
(93)
0.0000
0.7760
(93)
0.0000
0.8114
(93)
0.0000
0.7889
(93)
0.0000
0.8729
(93)
0.0000
0.8976
(93)
0.0000
Caballos de
fuerza
-0.7893
(93)
0.0000
-0.7100
(93)
0.0000
0.8142
(93)
0.0000
-0.0587
(93)
0.5731
0.7891
(93)
0.0000
0.6444
(93)
0.0000
0.6054
(93)
0.0000
0.7389
(93)
0.0000
0.8043
(93)
0.0000
RPM
0.3896
(93)
0.0002
0.3156
(93)
0.0025
-0.5295
(93)
0.0000
-0.0587
(93)
0.5731
-0.2741
(93)
0.0086
-0.4231
(93)
0.0000
-0.4401
(93)
0.0000
-0.5046
(93)
0.0000
-0.4164
(93)
0.0001
Tanque de
comb.
-0.8836
(93)
0.0000
-0.8389
(93)
0.0000
0.7760
(93)
0.0000
0.7891
(93)
0.0000
-0.2741
(93)
0.0086
0.6577
(93)
0.0000
0.7424
(93)
0.0000
0.7775
(93)
0.0000
0.8942
(93)
0.0000
Longitud
-0.6624
(93)
0.0000
-0.5473
(93)
0.0000
0.8114
(93)
0.0000
0.6444
(93)
0.0000
-0.4231
(93)
0.0000
0.6577
(93)
0.0000
0.8233
(93)
0.0000
0.7961
(93)
0.0000
0.7885
(93)
0.0000
Mtodo el mtodo usado para calcular los coeficientes de correlacin por rango.
Covarianzas
Las covarianzas proven una medida de la extensin en la que dos variables varan juntas.
Covarianzas
MPG
MPG
Tamao de Caballos de RPM
Tanque Longitud
Ciudad
Carretera
motor
fuerza
de comb.
MPG Ciudad 31.5823
28.2834
-4.13917 -197.98
1217.48 -14.9858 -54.6733
(93)
(93)
(93)
(93)
(93)
(93)
(93)
MPG Carretera 28.2834
28.4273
-3.46676 -172.865
997.335 -13.7437 -42.2678
(93)
(93)
(93)
(93)
(93)
(93)
(93)
Tamao de
-4.13917 -3.46676
1.07612
39.777
-339.164 2.58308 11.8197
motor
(93)
(93)
(93)
(93)
(93)
(93)
(93)
Covarianza
Caballos de
-197.98
-172.865
39.777
2743.08
1146.63 122.254 421.296
(Tamao de Muestra)
fuerza
(93)
(93)
(93)
(93)
(93)
(93)
(93)
997.335 x y -339.164
1146.63
356089.
-652.325
LaRPM
covarianza 1217.48
entre la variable
la variable
y se calcula
a partir
de -3844.92
(93)
(93)
(93)
(93)
(93)
(93)
(93)
Tanque de
-14.9858n -13.7437
2.58308
122.254
-652.325 10.7543 33.0638
comb.
xi x y i y
(93)
(93)
(93)
(93)
(93)
(93)
(93)
i =1
y) =
Longitudcov( x,-54.6733
-42.2678
11.8197
421.296
-3844.92 33.0638 213.23
(93)
(93)n 1
(93)
(93)
(93)
(93)
(93)
Wheelbase
-25.5671 -22.3758
5.18194
173.893
-1903.77 16.9448 82.022
(93)pueden(93)
(93) usarse
(93)en otros
(93)clculos
Las covarianzas
guardarse (93)
en la hoja(93)
de datos para
Ancho
-15.3021 -12.9023
3.39923
127.544
-1217.09 9.89828 45.3679
desea.
(93)
(93)
(93)
(93)
(93)
(93)
(93)
Peso
-2795.09 -2549.65
517.133
22825.5
-150636. 1729.47 6945.16
(93)
(93)
(93)
(93)
(93)
(93)
(93)
)(
(1)
si as se
Correlaciones Parciales
El panel Correlaciones Parciales despliega coeficientes que miden la fuerza de la relacin entre
cada par de variables que ya se hayan computado para las relaciones con las otras variables:
Correlaciones Parciales
MPG Ciudad MPG Carretera
MPG Ciudad
(Tamao
de Muestra)0.8507
MPG Carretera
Valor-P
(93)
0.0000
Tamao de motor 0.0891
(93)
2006 por StatPoint,
Inc.
0.4174
Caballos de fuerza -0.2369
(93)
0.0290
Tamao de
motor
0.8507
0.0891
(93)
(93)
0.0000Correlacin 0.4174
-0.0192
(93)
0.8613
-0.0192
(93)
0.8613
0.1925
0.6729
(93)
(93)
0.0776
0.0000
Caballos de
fuerza
-0.2369
(93)
0.0290
0.1925
(93)
0.0776
0.6729
(93)
0.0000
RPM
0.1960
(93)
0.0723
-0.1126
(93)
0.3051
-0.6704
(93)
Multiple
0.0000
0.7994
(93)
0.0000
Tanque de
comb.
-0.1007
(93)
0.3590
-0.0415
(93)
0.7060
0.0208
(93)
Variable
0.8504
0.0237
(93)
0.8295
Longitud
Ancho
-0.4046
(93)
0.0001
0.3896
(93)
0.0002
0.2344
(93)
Analysis
0.0308
-0.1796
(93)
0.1001
-0.0125
(93)
0.9096
0.0849
(93)
0.4396
0.1479
(93)
90.1768
0.1145
(93)
0.2969
Llave Glifo
Se han desarrollado muchos mtodos para desplegar datos multivariados. Un mtodo til es el
del glifo. Un glifo es una figura simblica construida para desplegar el valor de variables
cuantitativas mltiples. El procedimiento Anlisis de Mltiples Variables genera glifos en forma
de polgonos:
MPG City
Weight
MPG Highway
Width
Engine Size
Wheelbase
Horsepower
Length
RPM
Fueltank
La distancia desde el centro de la figura a cada vrtice se usa para representar el valor relativo de
una variable seleccionada. Por ejemplo, el vrtice de la posicin de las seis en punto representa el
tamao del tanque de combustible. Un carro con un tanque de gran capacidad tendr un vrtice
localizado lejos del centro en esa direccin, mientras el vrtice para un carro con un tanque
pequeo estar mucho ms cerca del centro.
Grficas de Estrellas
El panel Grficas de Estrella crea glifos con el siguiente formato:
Integra
Legend
90
100
535i
Century
LeSabre
Roadmaster
Riviera
DeVille
Seville
Cavalier
Corsica
Camaro
Lumina
Lumina_APV
Astro
Caprice
Corvette
Concorde
LeBaron
Imperial
Colt
Shadow
Spirit
Pueden deslegarse al mismo tiempo glifos para ms de 25 filas. Los polgonos se estructuran de
tal manera que la distancia de un vrtice al centro es muy pequea para la fila con un valor
mnimo de la variable relevante y de longitud mxima para la fila con el mayor valor.
Los glifos son bastante tiles al conglomerar las filas, i.e., identificar filas que son similares entre
s. Por ejemplo, el LeBaron, el Shadow, y el Spirit tienen valores promedio en todas las variables
y por lo tanto tienen forma similar. Casos inusuales tales como el Astro tambin funcionan (tiene
un tanque de combustible inusualmente grande).
Panel de Opciones
Variable Etiqueta: variable (si hay) usada para etiquetar cada glifo.
Etiqueta: Los glifos pueden etiquetarse por su nmero de fila y por el valor de una columna
seleccionada en la hoja de datos.
Nmero de Fila Inicial: Los glifos para ms de 25 filas se desplegarn al mismo tiempo,
comenzando con el nmero de fila especificado.
Grficas de Rayos
Las Grficas de Rayos son similares a las grficas de estrellas pero tienen un formato
ligeramente diferente:
Integra
Legend
90
100
535i
Century
LeSabre
Roadmaster
Riviera
DeVille
Seville
Cavalier
Corsica
Camaro
Lumina
Lumina_APV
Astro
Caprice
Corvette
Concorde
LeBaron
Imperial
Colt
Shadow
Spirit
La mayor diferencia es la ubicacin de los vrtices. Para cada variable, el vrtice se localiza en el
medio del rayo si el valor de esa variable es igual a la media muestral. Se localiza al final del
rayo si est 3 o ms desviaciones estndar por encima de la media y muy cerca del centro de la
figura si el valor est 3 o ms desviaciones estndar por debajo de la media muestral.
Para el Astro, note que el tamao de su tanque es al menos 3 desviaciones estndar ms grande
que la media de los 93 automviles.
Guardar Resultados
Los siguientes resultados pueden guardarse en la hoja de datos:
1.
2.
3.
4.
(x
r=
i =1
x )( y i y )
i=1
i =1
(2)
(x i x ) 2 ( y i y )2
t=
(n 2)r 2
(3)
1 r2
R=
A + B Di2
(4)
i =1
2 AB
donde
Di = U i Vi
(5)
gx
A=
j =1
(6)
12
gy
B=
n n t 3j , x t j , x
3
n 3 n t 3j , y t j , y
j =1
(7)
12
(8)
S
n(n 1)
t 3j , x t j , x
2
j =1
gx
y
n(n 1)
t 3j , y t j , y
2
j =1
(9)
donde S es el nmero total de pares concordantes de observaciones (pares en donde (Ui - Uj)(Vi Vj) es positivo) menos el nmero de pares discordantes de observaciones (pares en donde (Ui Uj)(Vi - Vj) es negativo). La significancia de la correlacin se encuentra comparando
z=
n(n 1)(2n + 5) / 18
(10)