Está en la página 1de 9

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias

Anlisis de Datos

ndice

Escalado multidimensional......................................................................................................................2
Datos....................................................................................................................................................2
Clculos...............................................................................................................................................2
Resultados...........................................................................................................................................3
Anlisis de correspondencia....................................................................................................................4
Datos....................................................................................................................................................4
Clculos...............................................................................................................................................4
Resultados...........................................................................................................................................5
Anexos.....................................................................................................................................................8
Fuente de consulta...................................................................................................................................9
Responsable.............................................................................................................................................9

Anlisis de correspondencia-Escalado multidimensional

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias


Anlisis de Datos

Escalado multidimensional
Se dispone de una matriz, D, cuadrada n n de distancias o disimilaridades entre los n elementos de
un conjunto.
Para este estudio se ha tomado datos de las distancias existentes entre las principales ciudades del
Ecuador.
Datos

CUADRO DE DISTANCIAS ENTRE LAS PRINCIPALES CIUDADES DEL ECUADOR


1
A
m
b
a
t
o

1.Ambato

2
A
z
o
g
u
e
s

3
B
a
b
a
h
o
y
o

4
C
u
e
n
c
a

9
L
a
t
a
c
u
n
g
a

11
M
a
c
a
r

13
M
a
c
h
a
l
a

14
M
a
n
t
a

15
P
o
r
t
o
v
i
e
j
o

16
P
u
y
o

17
Q
u
i
t
o

18
R
i
o
b
a
m
b
a

20
S
t
o.
D
o
m
i
n
g
o

21
T
e
n
a

22
T
u
l
c

23
Z
a
m
o
r
a

24
L
a
g
o
A
g
r
i
o

367 575

397
664

83 121 445 267 440

427 427 216 281 246 298 304 182

584 207 377

580 504

599

0 667 250 289 557 353 205

395 231 188 446 444 370 442 254

686 482 449

682 269

700

819 620 608 442 407 491 318 442

562 185 497

558 896

579

402 432 191 196 194 349 420 233

664 287 428

660 481

679

684 305 337 402 367 176 235

61

479 328 255

475 558

496

952 479 633 505 470 350 115 303

129 248 271

125 826

365

748 277 429 355 320 148

99

323 158 227

329 622

350

190 436 235 611 609 519 647 459

891 647 598

887

904

37 630 213 252 520 316 242

5.Esmeraldas

390 630 392 667

6.Guayaquil

288 213

0 275 392

0 472 489 433 343 832

83 250 472

0 204 535 335 415

99 252 121 289 489 204

0 350 146 494

251 520 455 557 433 535 350

0 204 762

47 316 267 353 343 335 146 204

0 558

10.Loja

511 242 440 205 832 415 494 762 558

11.Macar

701 432 427 395 819 402 684 952 748 190

701 230 382 404 369 101 136

19
R
u
m
i
c
h
a
c
a

645 306

306

47 511

12
M
a
c
a
s

649 445 412

220 238

99 251

10
L
o
j
a

380 205 180

4.Cuenca

37 275

8
I
b
a
r
r
a

432 219 225 409 407 333 404 217

3.Babahoyo

9.Latacunga

0 238

7
G
u
a
r
a
n
d
a

52

269

8.Ibarra

6
G
u
a
y
a
q
u
i
l

0 269 220 306 390 288

2.Azoquez

7.Guaranda

5
E
s
m
e
r
a
l
d
a
s

89

64

0 626 222 598 596 709 837 649 1081 634 778 1077 254 1084

12.Macas

230 219 427 231 620 432 305 479 277 436

626

13,Machala

382 225 216 188 608 191 337 633 429 235

222 419

0 419 628 626 129 366 245


0 387 385 444 518 328

608 435 208

604 326

456

762 423 523

758 299

766

14.Manta

404 409 281 446 442 196 402 505 355 611

598 628 387

35 505 390 456

634 257 584

630 675

649

15.Portoviejo

369 407 246 444 407 194 367 470 320 609

596 626 385

35

0 470 355 427

599 222 549

595 675

614

16.Puyo

101 333 298 370 491 349 176 350 148 519

709 129 444 505 470

17.Quito

136 405 304 442 318 420 235 115

89 647

837 366 518 390 355 237

99 459

649 245 328 456 427 116 188

18.Riobamba
19.Rumichaca

79

475 455

327

244 133 186

240 711

259

432 257 195

428 523

440

380 649 584 686 562 664 479 129 323 891 1081 608 762 634 599 479 244 432

0 377 400

4 955

492

52 217 182 254 442 233

61 303

0 237 116
0 188

479 306

20.Sto.Domingo 205 445 207 482 185 287 328 248 158 647

634 435 424 257 222 306 133 257

377

21.Tena

180 412 377 449 497 428 255 271 227 598

788 208 523 584 549

400 312

22.Tulcn

376 645 580 682 558 660 475 125 329 887 1077 604 758 630 595 475 240 428

23.Zamora

575 306 504 269 896 481 558 826 622

254 326 299 675 675 455 711 523

955 711 534

951

781

24.Lago agrio

397 664 599 700 579 679 496 365 350 904 1084 456 766 649 614 327 259 440

492 394 248

488 781

64

79 186 195

0 312

373 711

394

396 534

248

4 373 396

0 951

Clculos
Matriz similitud entre individuos

Q=

Anlisis de correspondencia-Escalado multidimensional

488

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias


Anlisis de Datos

Las distancias entre las observaciones se deducen inmediatamente de esta matriz de similitud. La
distancia eucldea al cuadrado es:

Puede calcularse en funcin de los trminos de la matriz Q, por la expresin

Matriz de similitud Q = VVT = V1/21/2VT = (V1/2)(V1/2)T;


V = vectores propios
= matriz de valores propios diagonal
Coordenadas a representar X= V1/2;
Grado de bondad

| |

Resultados
Valores propios y vectores propios
Valores
Propios
182,627
63,462
24,567
14,023
7,278
4,949
1,903
1,328
1,149
0,300
0,210
0,003
0,000
-0,082
-0,255
-0,315
-0,549
-1,524
-1,761
-4,583
-5,923
-8,178
-8,406
-13,769

Vectores Propios
V1
V2
0,064
0,052
-0,146
0,078
-0,069
-0,157
-0,175
0,096
0,157
-0,355
-0,121
-0,187
0,018
0,036
0,245
0,013
0,100
0,009
-0,327
0,140
-0,461
-0,183
-0,049
0,358
-0,222
-0,087
-0,028
-0,386
-0,010
-0,371
0,040
0,199
0,168
-0,004
0,023
0,087
0,330
0,026
0,098
-0,208
0,103
0,252
0,327
0,026
-0,340
0,326
0,275
0,241

Anlisis de correspondencia-Escalado multidimensional

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias


Anlisis de Datos

Grado de bondad
Ciudad

X1

X2

1.Ambato

0,506

0,256

2.Azoquez

-1,159

0,388

3.Babahoyo

-0,551 -0,781

4.Cuenca

-1,391

1,248 -1,759

6.Guayaquil

-0,963 -0,928

7.Guaranda

0,139

0,177

8.Ibarra

1,951

0,065

9.Latacunga

0,796

0,043

10.Loja

-2,606

0,693

11.Macar

-3,673 -0,908
-0,389

2,500

2,000

1,500

1,000

0,500

-1,765 -0,434

14.Manta

-0,226 -1,911

15.Portoviejo

-0,082 -1,838

16.Puyo

0,322

17.Quito

1,339 -0,022

18.Riobamba

0,183

0,434

19.Rumichaca

2,629

0,129

20.Sto.Domingo

0,784 -1,030

21.Tena

0,823

0,000

Rumichaca

0,500

1,000

2,000
3,000

LagoAgrio

Latacunga
Ambato
Riobamba
Guaranda

StoDomingo

Portoviejo

1,000

Tena
Puyo

0,000
Macas

Babahoyo
Guayaquil

0,988

1,000

Azogues
Cuenca
Machala

2,000
Loja

Zamora
3,000

1,249

22.Tulcn

2,607

0,127

23.Zamora

-2,712

1,614

2,190

1,197

Macar
4,000

Anlisis de correspondencia
Datos
ElnmerodetiposdeempresascreadassegnlasregionesdelEcuador

Sierra
Costa
Oriente
Galpagos

Pequea Mediana Grande


20
80
100
10
50
300
5
10
30
10
10
40

Clculos
Equivalencia entre los puntos perfiles de fila y columna y la distancia Chi-2

2,000

Quito

Esmeraldas

Manta

1,500

Tulcan
Ibarra

1,773

13,Machala

24.Lago agrio

Coordenadas de las ciudades del Ecuador

0,478

5.Esmeraldas

12.Macas

. .
. .

.
.

Inercia total

Anlisis de correspondencia-Escalado multidimensional

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias


Anlisis de Datos

Resultados
Frecuencia observada
Pequea Mediana Grande Total
Sierra
20
80
100
200
Costa
10
50
300
360
Oriente
5
10
30
45
Galpagos
10
10
40
60
Total
45
150
470
665
Frecuencia relativa
Pequea Mediana Grande Total
Sierra
0,030
0,120
0,150
0,301
Costa
0,015
0,075
0,451
0,541
Oriente
0,008
0,015
0,045
0,068
Galpagos
0,015
0,015
0,060
0,090
Total
0,068
0,226
0,707
1,000
Frecuencia esperada
Pequea Mediana Grande Total
Sierra
13,534 45,113 141,353 200,000
Costa
24,361 81,203 254,436 360,000
Oriente
3,045 10,150 31,805 45,000
Galpagos
4,060 13,534 42,406 60,000
Total
40,940 136,466 427,594 665,000

Equivalencia entre los puntos perfiles de fila y columna y la distancia Chi-2


Chi-2
Pequea Mediana Grande Total
Sierra
3,089 26,979 12,098 42,167
Costa
8,466 11,990
8,159 28,615
Oriente
1,255
0,002
0,102
1,360
Galpagos
8,690
0,923
0,137
9,749
Total
12,810 38,972 20,360 81,891

Interpretacin de la prueba:
H0: Las regiones del Ecuador y el tipo de empresas son independientes.
Ha: Hay una dependencia entre las regiones del Ecuador y el tipo de empresas creadas en Ecuador.
Como 81,89 no es menor X(0,05)=12,59; se debe rechazar la hiptesis nula H0, y aceptar la hiptesis
alternativa Ha.
Inercia total = 0,12314

Anlisis de correspondencia-Escalado multidimensional

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias


Anlisis de Datos

Perfil fila y perfil columna


Frecuencia relativa fila
Pequea Mediana Grande Total
Sierra
0,100
0,400
0,500
1,000
Costa
0,028
0,139
0,833
1,000
Oriente
0,111
0,222
0,667
1,000
Galpagos
0,167
0,167
0,667
1,000
Total
0,068
0,226
0,707
1,000

Frecuencia relativa columna


Pequea Mediana Grande Total
Sierra
0,444
0,533
0,213
0,301
Costa
0,222
0,333
0,638
0,541
Oriente
0,111
0,067
0,064
0,068
Galpagos
0,222
0,067
0,085
0,090
Total
1,000
1,000
1,000
1,000

Matriz diagonal de pesos tanto filas como columnas con su inversa


Df
0,301
0
0
0
0 0,541
0
0
0
0 0,068
0
0
0
0 0,090

Df-1
3,325
0
0
0
0 1,847
0
0
0
0 14,78
0
0
0
0 11,08

Dc
0,068
0
0
0 0,226
0
0
0 0,707

Dc-1
14,78
0
0
0 4,433
0
0
0 1,415

Estudio del perfil fila


Matriz de inercias-Perfil fila
0,100
0,081
0,270
0,286
0,630
0,633
Vectores propios
1,000
0,091
0,105
0,303
0,018
0,949

0,189
0,593
-0,782

0,060
0,202
0,738

0,692
-0,721
0,030

Los vectores propios deben cumplir vTDc-1v=1,


pero como no cumplen dividimos para su norma
2,955
9,381

0,110
0,345
-0,455

0,226
-0,236
0,010

Anlisis de correspondencia-Escalado multidimensional

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias


Anlisis de Datos

Proyecciones
F=Df-1PcV; V normalizado

Sierra
Costa
Oriente
Galpagos

F1
F2
0,453 0,077
0,279 0,041
0,091 0,148
0,096 0,391

0,200
0,100

Sierra

Costa

0,400

0,000
0,200
0,000
0,100

0,200

0,400

0,600

Oriente
0,200
0,300
0,400

Galpagos

0,500

Contribuciones(filas):
Peso

(relativo)
Sierra
0,301
Costa
0,541
Oriente
0,068
Galpagos
0,090

F1
0,586
0,401
0,005
0,008

F2
0,099
0,050
0,082
0,768

Estudio del perfil columna


Matriz de inercias-Perfil columna
0,364
0,264
0,475
0,584
0,070
0,066
0,091
0,086
0
0,01799
0,10515
1

0,23199
0,23199
-0,8584
0,39439

0,47577
0,45428
-0,2054
-0,7246

0,310
0,524
0,070
0,096

0,305
0,518
0,072
0,105

0,66865 0,47778
-0,7417 0,86001
0,03033 0,1075
0,04274 0,14334

Los vectores propios deben cumplir vTDf-1v=1, pero


como no cumplen dividimos para su norma

Anlisis de correspondencia-Escalado multidimensional

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias


Anlisis de Datos

2,536 0,75765 1,84056


7,577 0,72343 -2,0417
-0,3271 0,08349
-1,1539 0,11765
Proyecciones
F=Dp-1PfTV; V normalizado

Pequea
Mediana
Grande

F1
0,527
0,496
0,209

F2
0,448
0,140
0,002

0,200
Mediana
0,100
0,000
Grande
0,400 0,200 0,000
0,100

0,200

0,400

0,600

0,200
0,300
0,400
Pequea
0,500

Contribuciones(columnas):
Peso

(relativo)
F1
F2
Pequea
0,068 0,178 0,754
Mediana
0,226 0,528 0,246
Grande
0,707 0,293 0,000

Anexos
CD-ROM:
Clculos, Tablas y grficas estn anexados en archivos separados:
mapa-24ciudadesEcuador.xls
correspondencia.xls
adjuntos en esta carpeta, desarrollados con la ayuda de Excel 2003, Matrix(componente para Excel) y
XLSTAT

Anlisis de correspondencia-Escalado multidimensional

Facultad de Ingeniera Ciencias Fsicas y Matemtica - Escuela de Ciencias


Anlisis de Datos

Fuente de consulta

Pea D, (2002). Anlisis de datos multivariantes, Espaa.


http://jjgibaja.wordpress.com/
http://cs.uns.edu.ar/~cic/dm2009/downloads/transparencias/01_dm.pdf

Responsable

Firma
Quituisaca Samaniego Lilia

Anlisis de correspondencia-Escalado multidimensional