Está en la página 1de 21

Mtodos Avanzados de Anlisis de Datos

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA

PROGRAMA DE DOCTORADO EN AGRICULTURA SUSTENTABLE

TRABAJO ENCARGADO 2
Curso: Mtodos Avanzados de Anlisis de Datos
Docente: Tarazona Vargas, Enver Gerard
Estudiante: CESAR PAUL LAQUI VILCA

La Molina, 10 de Marzo del 2012

Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

I. Anlisis de Casos Atpicos. Con el fichero empleados.sav


1.1) Realice el Anlisis de Outiliers Univariado Para la Variable Salario Inicial.
a) Conjunto de Datos:

Los datos estn compuestos por 11 factores y 474 empleados. La herramienta a usarse es el SPSS.

Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

b) Resultados

b.1 Grfico de Cajas como criterio para detectar valores outliers


Figura 1. Grfico de Cajas

ANALISIS DE LOS RESULTADO:


En la Figura 1, se muestra la distribucin de los datos en funcin a una media, all
se observa la presencia de valores muy lejanas a esa media y que posiblemente
sean valores atpicos, los valores que aparentemente son atpicos presentan una
nube con asteriscos (*), la presencia de estas puede deberse a que posiblemente
presentan caractersticas distintas en relacin al resto de valores. Para corroborar
estos resultados se realiza una estandarizacin de datos.

Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

b.2. Estandarizacin de Datos


Para el clculo y estandarizacin se requiere la determinacin previa de la media y
desviacin estndar de los datos, los valores obtenidos se muestran en la tabla 1.
Tabla 1. Media y Desviacin Estndar del Conjunto de Datos
Estadsticos descriptivos
N

Mnimo

Salario inicial

474 $9,000

N vlido (segn lista)

474

Mximo
$79,980

Media
$17,016.09

Desv. tp.
$7,870.638

Presentan una media de 17 016.00 dlares y una desviacin estndar de


7870.638 dlares en funcin a la media calculada.
El procedimiento seguido es la siguiente:

La nueva variable estandarizada aparece al final de la tabla de datos y en ella


buscamos aquellos casos en los que la nueva variable estandarizada adquiere
valores mayores a 3 o menores a -3, estos sern reconocidos como valores
outliers de forma univariada.
Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

Los valores encontrados fuera del margen 3 y -3 son:


Tabla 2. Valores outliers de forma univariada
Id
173
456
198
446
32
431
160
205
343
29

sala_ini_estand
3.24
3.24
3.36
3.44
3.56
3.56
3.87
4.51
5.46
8

Los valores de la Tabla 2, son los valores outliers de forma univariada.


1.2 Realice el anlisis de outiliers multivariado para la variable salario actual
en funcin del salario inicial, el nmero de meses desde el contrato y la
experiencia previa.
Se realiz por el mtodo Distancia de Mahalanobis para detectar casos outliers, de
los valores encontrados y ordenado en forma ascendente se tienen los primeros
30 datos, de los cuales presentan los en la Tabla 3:
Tabla 3. Mahalanobis de los 30 primeros datos ascendentes.
id
207
220
275
240
216
204
211
212
183
221
300

Mahalanobis
0.0020
0.0023
0.0028
0.005
0.0061
0.0087
0.01
0.0121
0.0156
0.0184
0.0184
Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

271
177
233
202
308
203
228
184
282
172
292
269
234
296
218
312
322
201
316

0.0222
0.0254
0.0278
0.0319
0.0366
0.0367
0.0402
0.0409
0.0436
0.0438
0.0442
0.05
0.0517
0.0522
0.0548
0.0554
0.0577
0.0578
0.0602

De estos valores ubicamos los casos en donde la evaluacin con una Chi
cuadrado sea menor a 0.001, notamos que ninguno de los casos tienen valor 0 y
por lo tanto ninguno seria reconocido casos outliers de forma multivariada.
II.

Con el fichero datosincompletos.sav. Realice el anlisis de datos


perdidos. Determine si los valores perdidos son aleatorios.

Se busca determinar si los datos son aleatorios o no para lo cual:


2.1. Se decodifican los valores de la siguiente forma:

Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

Haciendo uso de la sintaxis del programa

Se tiene los valores recodificado siguientes:

Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

Los valores recodificado son los siguientes:


v1

v2

v3

v4 v5

v6

v7

v9 v10 v11 v21 v31 v41 v51 v61 v71 v91 v101

1 3.3

0.9 8.6

1.8 6.3 41

4.5

2 3.5

0.4

3 1.2 1.7 5.2 35

3.3

7 3.5

55

5.2

4 9.1

4 3.1

1.5 7.7

5 1.9 2.5 7.2 36

3.9

5 5.1

1.4 8.3

5 3.3 2.6 3.8 49

4.9

6 4.6

2.1 7.9

6 3.4 2.8 4.7

5.9

7 4.5

1.5 6.1

5 1.9 2.5 7.2 36

2.8

8 5.2

1.3 9.7

6 3.2 3.9 6.7 54

5.8

2.8 9.9

4 3.1 1.7 5.4 49

5.4

10 4.1

3.7 5.9

8 3.2 3.5 9.1 43

4.8

11

2.8 7.8

12 4.8

7.6

3 3.8 7.9 49

4 3.3 1.4 5.8 39

5.5

13 3.1

8 3.6

4 5.9 43

5.2

14 3.7

2.7

6 2.2 1.8 8.3 33

3.6

15

0.5 6.7

5 2.2 2.1

31

16 3.3

1.6 6.4

5 2.1 2.1 8.4 25

3.4

17 6.1

0.5 9.2

5 3.3 2.8 7.1 60

5.2

18

2.8 5.2

2.6 2.7 8.4 38

3.7

19 3.1

2.2 6.7

7 2.6 2.9 7.7 43

4.3

20 6.5

0.1

7 3.2 3.7

5.4

8 33

Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

21 2.4

9.1

2 2.8 6.9 32

4.3

22 3.9

2.2 8.5

5 2.3 2.5 8.3 47

23 2.8

1.4 8.1

4 2.1 1.4 6.6 39

4.4

24 4.2 -0.5 8.6

6 2.7 3.7 6.7 49

25 4.7

3 2.6 6.8 54

5.9

1.3

10

26 3.4

2 9.7

5 2.7 1.7 4.8 49

4.7

27 3.2

3.2 5.7

5 3.6 2.9 6.2 46

4.4

28 4.9

1.8 7.7

6 3.4 1.5

5.6

29

1.4 9.7

5.9

30 4.7

1.3

31 3.7

0.7 8.2

6 2.1 2.5 7.4 41

32 4.7

2.8 8.2

5 3.6 2.5

9 53

5.2

33 4.5

2.9 8.2

6 2.5 3.5 8.8 50

4.6

34 2.8

6.7

5 2.5 2.6 9.2 32

3.7

35 3.8

0.8 8.7

1.6 2.8 5.6 39

5.7

36 2.9

2.6 7.7

7 2.8 3.6 7.7 47

4.2

37 4.9

2.6 7.4

7 4.6

4 9.6 62

6.2

38 4.6

2.5 9.6

3 7.7 65

39 4.3

1.8 7.6

2.5 4.4 46

5.6

40 4.3

1.5 9.9

3 1.3 1.2 1.7 50

41 3.1

1.9 6.7

5 2.7 3.1 3.8 54

4.8

42 5.1

1.9 9.2

6 3.6 2.3 4.5

6.1

43 4.1

1.1 9.3

6 2.5 2.7 7.4 47

5.3

44

3.8

5 3.4 2.6

6 42

4.2

45 4.3

2.6 6.8 55

3 3.2 8.5 42

3.4

1.4

3 2.6 2.3 6.8 45

4.9

47 4.2

2.5 9.2

6 3.3 3.9 7.3 59

48 5.7

0 6.4

3 2.5 7.1 46

4.5

49 5.3

1.6 8.5

4 3.5 1.9 4.8 58

4.3

50

3.7 5.3

4.8

3.2

5 3.1

8 43

3.3

3 3.9 6.8

46 3.7

51

2 5.8

40

3 2.3 9.1
3

52 2.8

3.8 8.9

7 3.3 3.2 8.2 53

53 4.8

2 9.3

6 3.7 2.4 4.6 60

6.1

3.4 8.4 47

3.8

3 1.7 1.1 6.2 35

4.1

54 3.4
55 3.9

1 6.1

56 3.9

3.3 7.5

5 2.5 2.4

39

3.6

57 3.6

2.7

6 3.7 2.5 9.3 44

4.8

58

0.9 9.1

5 2.4 2.6 7.3 46

5.1

59 1.6

2.1 6.9

2.6 8.9 29

3.9

60 4.9

2 6.4

5 2.1 2.2 8.8 28

3.3

Universidad Nacional Agraria La Molina

Mtodos Avanzados de Anlisis de Datos

61 3.6

4 9.3

62 5.6

8.2

63 3.6

2.3 9.9

7 3.8

64 5.2

1.3 9.1

65

6 4.5 2.6 9.5 37

3.9

4 4.1 57

4.9

5 3.3 2.7 7.3 60

5.1

4 1.6 5.3 55

2 6.6

7 2.4 2.7

41

66 4.2

2.4 9.4

5 3.2 2.7 8.5 49

5.2

67 3.8

0.8 9.5

0 2.2 2.6 5.3 42

5.1

68 3.3

2.6 9.7

3 2.9 1.5 5.2 47

5.1

69 2.6

1.9 9.1

5 1.5 3.1 9.9

3.3

70 4.5

1.6 8.7

5 3.1 2.1 6.8 56

5.1

Luego se procede con el clculo:

Universidad Nacional Agraria La Molina

10

10

Mtodos Avanzados de Anlisis de Datos

Los valores obtenidos son los siguientes:


Prueba de muestras independientes para comparar medias considerando las
variables independientes V2, al V10 los grupos de datos presentes y perdidos de
la primera variable representado por V11.
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
v2

Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v3 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v4 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v5 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v6 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v7 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v9 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v10 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales

.020

.552

.531

5.095

.152

.219

1.063

.417

Sig.
.888

.460

.469

.027

.698

.641

.307

.521

Prueba T para la igualdad de medias


95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.0069
2.0507

63

Sig.
(bilateral)
.052

Diferencia de
medias
1.0219

Error tp. de
la diferencia
.5148

1.792

3.321

.162

1.0219

.5702

-.6974

2.7412

.491

64

.625

.5726

1.1652

-1.7551

2.9004

.378

2.110

.740

.5726

1.5134

-5.6254

6.7706

-.254

66

.801

-.198

.782

-1.759

1.362

-.347

3.805

.747

-.198

.572

-1.820

1.423

.702

63

.485

.2653

.3779

-.4899

1.0205

1.929

10.880

.080

.2653

.1375

-.0378

.5684

-.031

67

.975

-.0117

.3766

-.7635

.7401

-.025

3.226

.982

-.0117

.4729

-1.4586

1.4353

-.135

63

.893

-.1209

.8920

-1.9034

1.6616

-.144

3.465

.894

-.1209

.8406

-2.6037

2.3620

-.003

63

.997

-.022

6.614

-13.240

13.195

-.006

1.216

.996

-.022

3.824

-32.319

32.275

.800

65

.426

.4267

.5331

-.6380

1.4914

1.091

3.815

.339

.4267

.3911

-.6804

1.5338

t
1.985

gl

Universidad Nacional Agraria La Molina

11

11

Mtodos Avanzados de Anlisis de Datos

Prueba de muestras independientes para comparar medias considerando como


variables independientes V1, V3 al V10, los grupos de datos presentes y perdidos
de la primera variable representado por V21
Prueba de muestras independientes
Prueba de Levene
para la igualdad
de varianzas

v3

Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v4 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v5 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v6 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v7 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v9 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v10 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v1 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales

F
1.149

.694

.273

.462

.003

.089

.608

2.437

Sig.
.288

.408

.603

.499

.953

.766

.438

.123

Prueba T para la igualdad de medias


95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1.8781
2.1929

t
.154

gl
64

Sig.
(bilatera
l)
.878

.275

4.662

.795

.1574

.5723

-1.3464

1.6612

-.880

66

.382

-.617

.701

-2.016

.782

-1.303

5.754

.242

-.617

.473

-1.787

.553

.231

63

.818

.0876

.3792

-.6702

.8454

.195

3.273

.857

.0876

.4504

-1.2803

1.4555

-.882

67

.381

-.2976

.3376

-.9713

.3762

-.769

4.469

.480

-.2976

.3869

-1.3287

.7336

.232

63

.818

.1862

.8042

-1.4209

1.7933

.240

4.751

.821

.1862

.7775

-1.8444

2.2168

-1.118

63

.268

-4.744

4.245

-13.227

3.738

-1.029

4.567

.355

-4.744

4.612

-16.945

7.456

-.978

65

.332

-.4688

.4795

-1.4264

.4889

-1.314

5.387

.242

-.4688

.3568

-1.3665

.4289

-.457

64

.649

-.2023

.4427

-1.0867

.6822

-.325

4.300

.761

-.2023

.6231

-1.8857

1.4811

Diferencia de
medias
.1574

Error tp. de la
diferencia
1.0189

Universidad Nacional Agraria La Molina

12

12

Mtodos Avanzados de Anlisis de Datos

Prueba de muestras independientes para comparar medias considerando como


variables independientes V1,V2, V4 al V10, los grupos de datos presentes y
perdidos de la primera variable representado por V31
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
v4

Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v5 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v6 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v7 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v9 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v10 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v1 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v2 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales

.358

2.777

.094

.949

.053

.042

1.265

2.855

Sig.
.552

.101

.760

.334

.819

.839

.265

.096

Prueba T para la igualdad de medias


95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.518
2.565

t
1.326

gl
66

Sig.
(bilateral)
.189

Diferencia de
medias
1.024

Error tp. de la
diferencia
.772

1.982

4.006

.118

1.024

.516

-.409

2.456

.850

63

.399

.4459

.5249

-.6031

1.4950

3.269

3.423

.039

.4459

.1364

.0406

.8513

1.252

67

.215

.4660

.3723

-.2771

1.2092

1.579

3.652

.196

.4660

.2952

-.3853

1.3173

.433

63

.667

.3853

.8908

-1.3948

2.1654

.648

4.071

.552

.3853

.5947

-1.2544

2.0250

-.269

63

.789

-1.279

4.750

-10.772

8.213

-.268

3.402

.804

-1.279

4.767

-15.486

12.927

.350

65

.727

.1874

.5352

-.8815

1.2563

.354

3.403

.744

.1874

.5288

-1.3880

1.7628

1.689

64

.096

.9311

.5512

-.1700

2.0322

1.028

2.065

.409

.9311

.9060

-2.8518

4.7140

-.416

63

.679

-.2527

.6070

-1.4657

.9603

-.229

2.052

.840

-.2527

1.1033

-4.8854

4.3800

Universidad Nacional Agraria La Molina

13

13

Mtodos Avanzados de Anlisis de Datos

Prueba de muestras independientes para comparar medias considerando como


variables independientes V1,V2, V3, V5, al v 10, los grupos de datos presentes y
perdidos de la primera variable representado por V41
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
v5

Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v6 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v7 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v9 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v10 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v1 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v2 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v3 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales

.049

2.138

.001

3.276

.238

.886

.197

.116

Sig.
.826

.148

.971

.075

.627

.350

.659

.735

Prueba T para la igualdad de medias


95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1.8089
.2650

63

Sig.
(bilateral)
.142

Diferencia de
medias
-.7720

Error tp. de
la diferencia
.5189

1.062

.371

-.7720

.5275

-6.6133

5.0694

.257

67

.798

.1349

.5244

-.9118

1.1816

1.203

7.491

.266

.1349

.1121

-.1268

.3966

.051

63

.959

.0635

1.2414

-2.4173

2.5443

.045

1.049

.971

.0635

1.4168

-16.0774

16.2045

1.083
5.624

63

.283

-7.098

6.553

-20.194

5.998

27.699

.000

-7.098

1.262

-9.684

-4.512

.049

65

.961

.0369

.7459

-1.4527

1.5265

.036

1.032

.977

.0369

1.0177

-11.9736

12.0474

-.889

64

.378

-.6045

.6803

-1.9636

.7546

1.421

1.177

.364

-.6045

.4253

-4.4200

3.2110

-.232

63

.817

-.1712

.7382

-1.6464

1.3039

-.170

1.033

.892

-.1712

1.0082

-12.0459

11.7035

-.591

64

.556

-.8366

1.4147

-3.6627

1.9896

-.473

1.040

.716

-.8366

1.7671

-21.3650

19.6919

t
1.488
1.464

gl

Universidad Nacional Agraria La Molina

14

14

Mtodos Avanzados de Anlisis de Datos

Prueba de muestras independientes para comparar medias considerando como


variables independientes V1,V2, V3, V4, V6 al v10, los grupos de datos presentes
y perdidos de la primera variable representado por V51
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
v6

Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v7 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v9 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v10 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v1 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v2 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v3 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v4 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales

.997

.003

.061

.027

.081

1.665

1.276

1.101

Sig.
.322

.960

.805

.869

.777

.202

.263

.298

Prueba T para la igualdad de medias


95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.7379
.6171

t
-.178

gl
67

Sig.
(bilateral)
.859

Diferencia de
medias
-.0604

Error tp. de la
diferencia
.3394

-.224

5.128

.832

-.0604

.2701

-.7495

.6288

.029

63

.977

.0234

.8045

-1.5844

1.6311

.028

4.639

.979

.0234

.8319

-2.1663

2.2131

-.450

63

.654

-1.928

4.280

-10.480

6.624

-.434

4.632

.684

-1.928

4.445

-13.634

9.778

.193

65

.848

.0932

.4829

-.8712

1.0575

.200

4.733

.849

.0932

.4649

-1.1223

1.3087

64
1.267
- 4.405
1.020

.210

-.5550

.4380

-1.4299

.3200

.360

-.5550

.5440

-2.0122

.9023

-.891

63

.376

-.4699

.5274

-1.5238

.5840

- 4.682
1.581

.179

-.4699

.2973

-1.2499

.3101

-.055

64

.956

-.0641

1.1674

-2.3962

2.2680

-.116

3.174

.915

-.0641

.5540

-1.7736

1.6454

.504

66

.616

.354

.704

-1.051

1.759

.748

5.770

.484

.354

.474

-.816

1.525

Universidad Nacional Agraria La Molina

15

15

Mtodos Avanzados de Anlisis de Datos

16

Prueba de muestras independientes para comparar medias considerando como


variables independientes V1,V2, V3, V4, V5, V7 al V10 los grupos de datos
presentes y perdidos de la primera variable representado por V61
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
v9

Se han asumido
varianzas iguales
No se han
asumido varianzas
iguales
v10 Se han asumido
varianzas iguales
No se han
asumido varianzas
iguales
v1 Se han asumido
varianzas iguales
No se han
asumido varianzas
iguales
v2 Se han asumido
varianzas iguales
No se han
asumido varianzas
iguales
v3 Se han asumido
varianzas iguales
No se han
asumido varianzas
iguales
v4 Se han asumido
varianzas iguales
No se han
asumido varianzas
iguales
v5 Se han asumido
varianzas iguales
No se han
asumido varianzas
iguales

Sig.
.

Prueba T para la igualdad de medias


95% Intervalo de confianza
para la diferencia
Sig.
Diferencia de Error tp. de la
(bilateral)
medias
diferencia
Inferior
Superior
.292
9.771
9.198
-8.611
28.153

t
1.062

gl
63

9.771

.511

65

.611

.5342

1.0447

-1.5523

2.6206

.5342

- 64
1.042
.
.

.301

-.9929

.9525

-2.8958

.9100

-.9929

2.037

63

.046

2.0448

1.0037

.0391

4.0504

2.0448

.685

64

.496

1.3594

1.9834

-2.6028

5.3216

1.3594

1.338

66

.186

2.018

1.508

-.994

5.030

2.018

.872

63

.387

.6421

.7363

-.8294

2.1136

.6421

Universidad Nacional Agraria La Molina

16

Mtodos Avanzados de Anlisis de Datos

Prueba de muestras independientes para comparar medias considerando como


variables independientes V1,V2, V3, V4, V5, V6,V9 y V10 los grupos de datos
presentes y perdidos de la primera variable representado por V71
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
v9

Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v10 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v1 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v2 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v3 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v4 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v5 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v6 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales

.507

.003

.508

.906

1.640

.081

.156

.565

Sig.
.479

.954

.479

.345

.205

.776

.694

.455

Prueba T para la igualdad de medias

gl
63

1.066
- 4.775
1.117

95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-13.017
3.962

Sig.
(bilateral)
.291

Diferencia de
medias
-4.528

Error tp. de la
diferencia
4.248

.317

-4.528

4.054

-15.099

6.044

-.146

65

.884

-.0785

.5356

-1.1482

.9913

-.159

3.473

.883

-.0785

.4939

-1.5358

1.3788

-.541

64

.590

-.2393

.4424

-1.1232

.6445

-.645

5.045

.547

-.2393

.3711

-1.1907

.7120

.796

63

.429

.3790

.4762

-.5726

1.3307

.610

4.365

.572

.3790

.6217

-1.2915

2.0496

-.284

64

.777

-.2610

.9184

-2.0957

1.5737

-.503

7.038

.630

-.2610

.5191

-1.4871

.9651

.831

66

.409

.583

.701

-.817

1.983

1.031

5.111

.349

.583

.566

-.862

2.028

-.215

63

.831

-.0734

.3420

-.7569

.6100

-.256

5.066

.808

-.0734

.2867

-.8075

.6607

67
1.316
- 3.794
1.801

.193

-.4894

.3719

-1.2316

.2529

.150

-.4894

.2717

-1.2602

.2815

Universidad Nacional Agraria La Molina

17

17

Mtodos Avanzados de Anlisis de Datos

Prueba de muestras independientes para comparar medias considerando como


variables independientes V1,V2, V3, V4, V5,V6, V7 y V10 los grupos de datos
presentes y perdidos de la primera variable representado por V91
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
v10 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v1 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v2 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v3 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v4 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v5 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v6 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v7 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales

.259

.476

.715

.045

1.699

.037

.055

2.110

Sig.
.612

.493

.401

.832

.197

.847

.815

.151

Prueba T para la igualdad de medias


95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.3857
1.5230

t
1.190

gl
65

Sig.
(bilateral)
.238

Diferencia de
medias
.5687

Error tp. de la
diferencia
.4778

1.048

4.494

.348

.5687

.5429

-.8754

2.0128

.256

64

.799

.1442

.5630

-.9806

1.2690

.190

2.101

.866

.1442

.7578

-2.9705

3.2588

.531

63

.597

.2535

.4775

-.7007

1.2078

.612

4.977

.568

.2535

.4146

-.8136

1.3207

.578

64

.565

.5298

.9166

-1.3013

2.3608

.639

4.867

.552

.5298

.8294

-1.6199

2.6794

.565

66

.574

.398

.703

-1.007

1.802

1.149

8.528

.282

.398

.346

-.392

1.187

.081

63

.936

.0277

.3421

-.6559

.7114

.073

4.537

.945

.0277

.3802

-.9804

1.0359

.778

67

.439

.2631

.3380

-.4116

.9377

.846

4.790

.438

.2631

.3111

-.5472

1.0733

.083

63

.934

.0667

.8045

-1.5410

1.6744

.059

4.309

.955

.0667

1.1253

-2.9712

3.1047

Universidad Nacional Agraria La Molina

18

18

Mtodos Avanzados de Anlisis de Datos

Prueba de muestras independientes para comparar medias considerando como


variables independientes V1,V2, V3, V4, V5,V6, V7 y V9 los grupos de datos
presentes y perdidos de la primera variable representado por V101
Prueba de muestras independientes
Prueba de Levene para
la igualdad de
varianzas

v1 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v2 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v3 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v4 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v5 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v6 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v7 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales
v9 Se han asumido
varianzas iguales
No se han
asumido
varianzas iguales

F
2.054

.027

1.227

1.299

1.134

.004

2.526

1.663

Sig.
.157

.870

.272

.258

.291

.953

.117

.202

Prueba T para la igualdad de medias

gl
64

1.406
- 3.187
2.974

95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1.8884
.3284

Sig.
(bilateral)
.165

Diferencia de
medias
-.7800

Error tp. de la
diferencia
.5548

.055

-.7800

.2623

-1.5877

.0277

-.229

63

.820

-.1391

.6076

-1.3532

1.0751

-.222

2.186

.843

-.1391

.6257

-2.6234

2.3453

-.205

64

.839

-.2387

1.1670

-2.5701

2.0927

-.440

3.243

.688

-.2387

.5428

-1.8952

1.4178

1.737

66

.087

1.522

.876

-.227

3.272

4.129

3.600

.018

1.522

.369

.452

2.592

-.893

63

.375

-.3856

.4318

-1.2485

.4773

- 2.532
1.374

.278

-.3856

.2807

-1.3800

.6088

.887

67

.378

.3805

.4291

-.4759

1.2370

.919

2.201

.447

.3805

.4140

-1.2533

2.0144

.601

63

.550

.7444

1.2379

-1.7294

3.2181

2.291

3.314

.097

.7444

.3249

-.2363

1.7250

-.330

63

.742

-1.796

5.439

-12.665

9.074

-.616

2.861

.584

-1.796

2.917

-11.341

7.749

De las tablas anteriores, se muestra que no hay diferencias significativas entre las
medias de los dos grupos definidos por los valores ausentes. Esto se puede
observar en los intervalos de confianza, que en todos los casos contienen al punto
cero.
Finalmente se puede afirmar que los valores ausentes se distribuyen de manera
aleatoria.

Universidad Nacional Agraria La Molina

19

19

Mtodos Avanzados de Anlisis de Datos

Por correlaciones
Correlaciones
v2
v3
v4
**
v1 Correlacin de Pearson
1 -.405
.220 -.086
Sig. (bilateral)
.001
.083
.498
N
66
61
63
64
v2 Correlacin de Pearson -.405**
1 -.201 .353**
Sig. (bilateral)
.001
.117
.004
N
61
65
62
63
*
v3 Correlacin de Pearson
.220
-.201
1 -.253
Sig. (bilateral)
.083
.117
.044
N
63
62
66
64
**
*
v4 Correlacin de Pearson
-.086 .353 -.253
1
Sig. (bilateral)
.498
.004
.044
N
64
63
64
68
**
**
**
v5 Correlacin de Pearson
.359
.446
.016 .383
Sig. (bilateral)
.004
.000
.901
.002
N
61
61
63
63
v6 Correlacin de Pearson
-.040
.154 -.052 .611**
Sig. (bilateral)
.752
.225
.682
.000
N
65
64
65
67
v7 Correlacin de Pearson
-.192
.302* -.282* .333**
Sig. (bilateral)
.137
.019
.028
.008
N
61
60
61
63
v9 Correlacin de Pearson
.386**
.117 .420**
.094
Sig. (bilateral)
.002
.372
.001
.463
N
63
60
61
63
v10 Correlacin de Pearson
.371**
-.200 .271*
.090
Sig. (bilateral)
.003
.119
.032
.477
N
63
62
63
65
**. La correlacin es significativa al nivel 0,01 (bilateral).
*. La correlacin es significante al nivel 0,05 (bilateral).
v1

v5
v6
**
.359
-.040
.004
.752
61
65
.446**
.154
.000
.225
61
64
.016 -.052
.901
.682
63
65
**
**
.383
.611
.002
.000
63
67
*
1 .318
.011
65
64
.318*
1
.011
64
69
.079 .327**
.549
.008
60
65
.586** .293*
.000
.019
60
64
.251*
.182
.050
.145
62
66

v7
-.192
.137
61
.302*
.019
60
*
-.282
.028
61
**
.333
.008
63
.079
.549
60
.327**
.008
65
1
65
-.255*
.049
60
-.347**
.005
63

v9
**
.386
.002
63
.117
.372
60
**
.420
.001
61
.094
.463
63
**
.586
.000
60
.293*
.019
64
-.255*
.049
60
1
65
.587**
.000
62

v10
**
.371
.003
63
-.200
.119
62
*
.271
.032
63
.090
.477
65
*
.251
.050
62
.182
.145
66
-.347**
.005
63
.587**
.000
62
1
67

Considerando la matriz de correlacin para las variables dicotmicas, esta matriz


muestra valores pequeos, esto muestra las bajas relaciones que existe entre los
valores ausentes en este conjunto de datos considerndose pares de variable en
cada contraste de la matriz. De esta forma se ratifica que los valores ausentes
siguen una distribucin aleatoria.
Dado que esta demostrado que los valores ausentes siguen una distribucin
aleatoria, podemos ahora realizar el proceso de imputacin con un mtodo sencillo
como la media o la mediana.
Estadsticos
v1

65

66

v4
68

v5

66

65

69

65

65

v10
67

Perdidos
Media

4
3.978

5
1.966

4
7.761

2
5.11

5
2.868

1
2.636

5
6.938

5
45.38

3
4.674

Mediana

3.911

2.000

8.200

5.15

3.000

2.600

7.100

46.00

4.900

3.0

2.0

9.7

3.3

2.5a

6.8

47a

5.2

Vlidos

Moda

v2

v3

v6

v7

v9

a. Existen varias modas. Se mostrar el menor de los valores.

Universidad Nacional Agraria La Molina

20

20

Mtodos Avanzados de Anlisis de Datos

Universidad Nacional Agraria La Molina

21

21

También podría gustarte