Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MANUALSPSS Statistcs Base User's Guide 17.0
MANUALSPSS Statistcs Base User's Guide 17.0
Si desea obtener ms informacin sobre los productos de software de SPSS Inc., visite nuestro sitio Web en http://www.spss.com
o pngase en contacto con
SPSS Inc.
233 South Wacker Drive, 11th Floor
Chicago, IL 60606-6412, EE.UU.
Tel: (312) 651-3000
Fax: (312) 651-3668
SPSS es una marca comercial registrada; los dems nombres de productos son marcas comerciales de SPSS Inc. para los
programas de software de su propiedad. El material descrito en este software no puede ser reproducido ni distribuido sin la
autorizacin expresa por escrito por parte de los propietarios de la marca registrada y de los derechos de la licencia en el
software y en los copyrights de los materiales publicados.
El SOFTWARE y la documentacin se proporcionan con DERECHOS LIMITADOS. Su uso, duplicacin o revelacin por
parte del Gobierno estn sujetos a las restricciones establecidas en la subdivisin (c)(1)(ii) de la clusula Rights in Technical
Data and Computer Software en 52.227-7013. El fabricante es SPSS Inc., 233 South Wacker Drive, 11th Floor, Chicago, IL
60606-6412, EE.UU.
N de patente 7,023,453
Aviso general: El resto de los nombres de productos mencionados en este documento se utilizan slo con fines identificativos y
pueden ser marcas comerciales de sus respectivas empresas.
Windows es una marca comercial registrada de Microsoft Corporation.
Apple, Mac y el logotipo de Mac son marcas comerciales de Apple Computer, Inc., registradas en Estados Unidos y en otros
pases.
Este producto utiliza WinWrap Basic, Copyright 1993-2007, Polar Engineering and Consulting, http://www.winwrap.com.
Impreso en EE.UU.
Queda prohibida la reproduccin, el almacenamiento en sistemas de recuperacin o la transmisin de cualquier parte de esta
publicacin en cualquier forma y por cualquier medio (electrnico o mecnico, fotocopia, grabacin o cualquier otro) sin
previa autorizacin expresa y por escrito de parte del editor.
Prefacio
aquellos casos en los que las muestras son pequeas o se distribuyen de forma poco uniforme y
puedan hacer que las pruebas habituales resulten poco precisas. Esta opcin slo est disponible
en los sistemas operativos Windows.
Missing Values describe los patrones de los datos perdidos, realiza una estimacin de las medias y
otros estadsticos y permite imputar los valores a las observaciones perdidas.
Complex Samples permite a los analistas de encuestas, mercado, salud y opinin pblica, as como
a los socilogos que utilizan una metodologa de encuesta de ejemplo, incorporar los diseos de
muestras complejas al anlisis de datos.
Decision Trees crea un modelo de clasificacin basado en rboles. y clasifica casos en grupos
o pronostica valores de una variable (criterio) dependiente basada en valores de variables
independientes (predictores). El procedimiento proporciona herramientas de validacin para
anlisis de clasificacin exploratorios y confirmatorios.
Data Preparation ofrece una rpida instantnea visual de los datos. Ofrece la posibilidad de aplicar
reglas de validacin que identifiquen valores de los datos no vlidos. Puede crear reglas que
marquen los valores fuera de rango, valores perdidos o valores en blanco. Tambin puede guardar
variables que registren cada una de las violaciones de las reglas y el nmero total de violaciones
de reglas por cada caso. Tambin se incluye un conjunto limitado de reglas predefinidas que
puede copiar o modificar.
Neural Networks se puede utilizar para tomar decisiones empresariales para pronosticar la
demanda de un producto en funcin del precio y otras variables, o al categorizar a los clientes
basndose en los hbitos de compra y las caractersticas demogrficas. Las redes neuronales
son herramientas de creacin de modelos de datos no lineares. Se pueden utilizar para modelar
relaciones complejas entre entradas y resultados para descubrir patrones en los datos.
EZ RFM realiza anlisis de RFM (actualidad, frecuencia, valor monetario) sobre archivos de datos
Para instalar Base sistema, ejecute el Asistente para autorizacin de licencia utilizando el cdigo
de autorizacin que le envi SPSS Inc.. Para obtener ms informacin, consulte las instrucciones
de instalacin proporcionadas con Base sistema.
iv
Compatibilidad
SPSS Statistics est diseado para ejecutarse en gran cantidad de sistemas de ordenadores.
Consulte las instrucciones de instalacin entregadas con su sistema para obtener informacin
especfica acerca de los requisitos mnimos y los recomendados.
Nmeros de serie
El nmero de serie es su nmero de identificacin con SPSS Inc.. Necesitar este nmero cuando
se ponga en contacto con SPSS Inc. para recibir informacin sobre asistencia, formas de pago o
actualizacin del sistema. El nmero de serie se incluye en el sistema Base de SPSS.
Servicio al cliente
Si tiene cualquier duda referente a la forma de envo o pago, pngase en contacto con su oficina
local, que encontrar en el sitio Web en http://www.spss.com/worldwide. Tenga preparado su
nmero de serie para identificarse.
Cursos de preparacin
SPSS Inc. ofrece cursos de preparacin, tanto pblicos como in situ. En todos los cursos habr
talleres prcticos. Estos cursos tendrn lugar peridicamente en las principales capitales. Si
desea obtener ms informacin sobre estos cursos, pngase en contacto con su oficina local que
encontrar en el sitio Web en http://www.spss.com/worldwide.
Asistencia tcnica
El servicio de asistencia tcnica est a disposicin de todos los clientes de mantenimiento. Los
clientes podrn ponerse en contacto con este servicio de asistencia tcnica si desean recibir ayuda
sobre el uso de SPSS Statistics o sobre la instalacin en alguno de los entornos de hardware
admitidos. Para ponerse en contacto con el servicio de asistencia tcnica, consulte el sitio Web
en http://www.spss.com, o pngase en contacto con la oficina ms cercana, que encontrar en el
sitio Web en http://www.spss.com/worldwide. Tenga preparada la informacin necesaria para
identificarse personalmente, a su organizacin y el nmero de serie de su sistema.
Publicaciones adicionales
SPSS Statistical Procedures Companion, por Marija Noru, ha sido publicado por Prentice
Hall. Se prev una nueva versin de este libro, actualizado para SPSS Statistics 17.0. El libro
SPSS Advanced Statistical Procedures Companion, que tambin se basa en SPSS Statistics 17.0,
se publicar muy pronto. El libro SPSS Guide to Data Analysis para SPSS Statistics 17.0 tambin
est en proceso de desarrollo. Las publicaciones anunciadas de forma exclusiva por Prentice
Hall estarn disponibles en el sitio Web en http://www.spss.com/estore (seleccione su pas de
origen y pulse en Books).
Contenido
1
Resumen
Obtencin de ayuda
11
Archivos de datos
13
vi
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
13
14
15
15
15
16
16
16
30
39
42
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
43
43
46
47
48
50
50
63
64
68
Acceso al servidor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Adicin y edicin de la configuracin de acceso al servidor .
Para seleccionar, cambiar o aadir servidores. . . . . . . . . . . .
Bsqueda de servidores disponibles . . . . . . . . . . . . . . . . . . .
Apertura de archivos de datos desde un servidor remoto . . . . . . .
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
69
70
71
72
Editor de datos
76
Vista de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Vista de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Para visualizar o definir los atributos de las variables . . . . . . . . . . . .
Nombres de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Nivel de medida de variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tipo de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Etiquetas de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Etiquetas de valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Insercin de saltos de lnea en etiquetas . . . . . . . . . . . . . . . . . . . . . .
Valores perdidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ancho de columna. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Alineacin de la variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aplicacin de atributos de definicin de variables a varias variables .
Atributos de variable personalizados . . . . . . . . . . . . . . . . . . . . . . . . .
vii
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
78
79
80
80
82
83
83
84
85
85
85
86
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
92
92
92
93
93
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
93
93
94
95
95
95
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
101
Preparacin de datos
106
.................
.................
.................
.................
.................
.................
107
108
110
111
112
113
viii
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
117
118
120
121
124
124
128
128
131
133
135
136
ix
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
157
158
159
161
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
171
172
175
176
181
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
187
187
188
188
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
197
197
198
199
200
200
204
205
207
209
210
...
...
...
...
...
..
..
..
..
..
211
212
214
215
216
218
Visor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
Mostrar y ocultar resultados . . . . . . . . . . . . . . . . . . . . . .
Desplazamiento, eliminacin y copia de resultados . . . . .
Cambio de la alineacin inicial. . . . . . . . . . . . . . . . . . . . .
Cambio de la alineacin de los elementos de resultados .
Resultados del Visor . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Adicin de elementos al Visor . . . . . . . . . . . . . . . . . . . . .
Bsqueda y sustitucin de informacin en el Visor. . . . . .
Copia de resultados a otras aplicaciones . . . . . . . . . . . . . . . .
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
..
..
219
219
220
220
220
222
223
224
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
..
..
..
227
228
229
231
233
234
235
236
237
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
237
238
239
240
241
11 Tablas pivote
243
xi
244
244
245
245
245
245
246
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
249
249
250
250
250
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
..
252
252
253
254
256
257
258
Fuente y fondo . . . . . . . . .
Formato de valor . . . . . . .
Alineacin y mrgenes . .
Texto y notas al pie . . . . . . . . .
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
259
259
260
261
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
261
262
262
262
263
263
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
xii
12 Modelos
267
270
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
..
..
..
275
276
277
277
278
280
281
281
283
14 Libro de cdigos
284
291
15 Frecuencias
xiii
16 Descriptivos
296
17 Explorar
300
305
18 Tablas de contingencia
19 Resumir
312
20 Medias
317
21 Cubos OLAP
322
xiv
22 Pruebas T
328
23 ANOVA de un factor
335
342
xv
25 Correlaciones bivariadas
355
26 Correlaciones parciales
359
27 Distancias
362
28 Regresin lineal
367
29 Regresin ordinal
377
xvi
30 Estimacin curvilnea
384
388
Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 390
Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
393
Vecinos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397
Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
Particiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 400
Guardado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
Opciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404
Vista de modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
Espacio de funciones . . . . . . . . . . . . . . . . . . . . . . . .
Importancia de la variable . . . . . . . . . . . . . . . . . . . . .
Homlogos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distancias de vecinos ms prximos . . . . . . . . . . . . .
Mapa de cuadrantes . . . . . . . . . . . . . . . . . . . . . . . . .
Registro de errores de seleccin de funciones . . . . .
Registro de errores de seleccin de k . . . . . . . . . . . .
Registro de errores de seleccin de funciones y k . .
Tabla de clasificacin . . . . . . . . . . . . . . . . . . . . . . . .
Resumen de error . . . . . . . . . . . . . . . . . . . . . . . . . . .
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
..
..
..
..
406
408
409
409
410
411
412
413
413
414
415
33 Anlisis discriminante
xvii
34 Anlisis factorial
423
431
433
441
447
xviii
39 Pruebas no paramtricas
452
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
454
454
455
455
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
458
458
459
459
...
...
...
...
...
..
..
..
..
..
462
463
463
464
464
...
...
...
...
...
...
...
...
..
..
..
..
465
466
466
466
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
467
468
468
468
469
xix
471
479
480
481
481
482
482
483
484
485
485
486
487
488
488
489
489
489
42 Anlisis de fiabilidad
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
..
..
491
43 Escalamiento multidimensional
496
xx
44 Estadsticos de la razn
502
45 Curvas COR
506
509
47 Utilidades
520
48 Opciones
525
xxi
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
536
536
537
537
538
548
554
xxii
Lista de origen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lista de destino . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Filtrado de listas de variables. . . . . . . . . . . . . . . . . . . . . . . . .
Casilla de verificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Cuadro combinado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Control de texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Control de nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Control de texto esttico . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Grupo de elementos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Grupo de seleccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Grupo de casillas de verificacin . . . . . . . . . . . . . . . . . . . . . .
Explorador de archivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Botn de sub-cuadro de dilogo . . . . . . . . . . . . . . . . . . . . . .
Cuadros de dilogo personalizados para comandos de extensin .
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
...
..
..
..
..
..
..
..
..
..
..
..
..
..
..
566
566
568
568
569
570
570
571
571
572
573
574
576
577
51 Trabajos de produccin
581
590
xxiii
Control de elementos de columna para las variables de control del archivo de datos . . . . . . 607
Nombres de variable en los archivos de datos generados por SGR . . . . . . . . . . . . . . . . . . . 609
Estructura de tablas OXML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 610
Identificadores SGR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 614
Copia de identificadores SGR desde los titulares del Visor . . . . . . . . . . . . . . . . . . . . . . . . . . 615
Apndice
A Convertidor de sintaxis de los comandos TABLES e IGRAPH 616
ndice
619
xxiv
Captulo
Resumen
multidimensionales. Explore las tablas reorganizando las filas, las columnas y las capas. Haga
importantes descubrimientos que suelen quedar velados en los informes convencionales. Compare
fcilmente los grupos dividiendo la tabla de manera que aparezca solamente un grupo cada vez.
Grficos de alta resolucin. Como funciones bsicas se incluyen grficos de sectores, grficos de
barras, histogramas, diagramas de dispersin y grficos 3-D de alta resolucin y a todo color,
entre muchos otros.
Acceso a bases de datos. Obtenga informacin de bases de datos mediante el Asistente para bases
de datos en lugar de utilizar consultas SQL de gran complejidad.
Transformaciones de los datos. Las funciones de transformacin le ayudarn a preparar sus datos
para el anlisis. Puede crear fcilmente subconjuntos de datos, combinar categoras, aadir,
agregar, fusionar, segmentar y transponer archivos, entre muchas otras posibilidades.
Ayuda en pantalla. Los tutoriales le ofrecern una introduccin global ampliamente detallada; los
temas de la Ayuda sensible al contexto de los cuadros de dilogo le guiarn a travs de la ejecucin
de tareas especficas; las definiciones de las ventanas emergentes para los resultados de las tablas
pivote le explicarn los trminos estadsticos y Estudios de casos le proporcionar ejemplos
prcticos sobre cmo utilizar los procedimientos estadsticos y cmo interpretar los resultados.
Lenguaje de comandos. Aunque la mayora de las tareas se pueden llevar a cabo simplemente
situando el puntero del ratn en el lugar deseado y pulsando en el botn, SPSS Statistics
proporciona adems un potente lenguaje de comandos que permite guardar y automatizar muchas
tareas habituales. El lenguaje de comandos tambin proporciona algunas funcionalidades no
incluidas en los mens y cuadros de dilogo.
1
2
Captulo 1
valores de datos perdidos. En un determinado conjunto de datos con valores perdidos, su resultado
es uno o ms conjuntos de datos en los que los valores perdidos se sustituyen por estimaciones
plausibles. Entonces podr obtener resultados combinados al ejecutar otros procedimientos. El
3
Resumen
procedimiento tambin resume los valores perdidos del conjunto de datos de trabajo. Esta funcin
est disponible en la opcin adicional Valores perdidos.
Anlisis de RFM. Anlisis de RFM (actualidad, frecuencia, valor monetario) es una tcnica
utilizada para identificar a clientes actuales que tienen ms posibilidades de responder a una nueva
oferta. Esta tcnica es muy comn en el marketing directo. Esta funcin est disponible en la
opcin adicional EZ RFM.
Mejoras en Regresin categrica. Regresin categrica se ha mejorado para incluir mtodos de
regularizacin y repeticin de muestreo para evaluar y mejorar la precisin de las predicciones.
En conjunto, estos nuevos mtodos permiten crear modelos innovadores, incluso para grandes
volmenes de datos (donde hay ms variables que observaciones, como en genmica). Esta
funcin est disponible en la opcin adicional Categoras.
Tablero. Las visualizaciones de tablero son grficos y diagramas creados a partir de una plantilla
Ajustar o reducir la escala de una tabla ancha en documentos de Word. Si desea obtener ms
informacin, consulte Opciones de Word/RTF en Captulo 10 el p. 228.
Crear nuevas hojas de trabajo o adjuntar datos a hojas de trabajo existentes en un libro de
trabajo de Excel. Si desea obtener ms informacin, consulte Opciones de Excel en Captulo
10 el p. 229.
Cambiar valores. Cambiar valores crea nuevas variables que contienen los valores de variables
especificar una variable de ruptura. Si desea obtener ms informacin, consulte Agregar datos en
Captulo 9 el p. 190.
Funcin Mediana. Ahora est disponible la funcin Mediana que calcula el valor medio de las
4
Captulo 1
Ventanas
Existen diversos tipos de ventanas en SPSS Statistics:
Editor de datos. El Editor de datos muestra el contenido del archivo de datos. Puede crear nuevos
archivos de datos o modificar los existentes con el Editor de datos. Si tiene ms de un archivo de
datos abierto, habr una ventana Editor de datos independiente para cada archivo.
Visor. Todas las tablas, los grficos y los resultados estadsticos se muestran en el Visor. Puede
editar los resultados y guardarlos para utilizarlos posteriormente. La ventana del Visor se abre
automticamente la primera vez que se ejecuta un procedimiento que genera resultados.
Editor de tablas pivote. Con el Editor de tablas pivote es posible modificar los resultados mostrados
en este tipo de tablas de diversas maneras. Puede editar el texto, intercambiar los datos de las filas
y las columnas, aadir colores, crear tablas multidimensionales y ocultar y mostrar los resultados
de manera selectiva.
Editor de grficos. Puede modificar los grficos y diagramas de alta resolucin en las ventanas de
los grficos. Es posible cambiar los colores, seleccionar diferentes tipos de fuentes y tamaos,
intercambiar los ejes horizontal y vertical, rotar diagramas de dispersin 3-D e incluso cambiar el
tipo de grfico.
Editor de resultados de texto. Los resultados de texto que no aparecen en las tablas pivote pueden
modificarse con el Editor de resultados de texto. Puede editar los resultados y cambiar las
caractersticas de las fuentes (tipo, estilo, color y tamao).
Editor de sintaxis. Puede pegar las selecciones del cuadro de dilogo en una ventana de sintaxis,
donde aparecern en forma de sintaxis de comandos. A continuacin puede editar esta sintaxis
de comandos para utilizar las funciones especiales que no se encuentran disponibles en los
cuadros de dilogo. Tambin puede guardar los comandos en un archivo para utilizarlos en
sesiones posteriores.
5
Resumen
Figura 1-1
Editor de datos y Visor
ventana).
E Pulse en el botn Designar ventana de la barra de herramientas (la que tiene el icono del signo ms).
o
E Elija en los mens:
Utilidades
Designar ventana
6
Captulo 1
Nota: en cuanto a las ventanas Editor de datos, la ventana Editor de datos activa determina el
conjunto de datos que se utiliza en anlisis o clculos posteriores. No hay ninguna ventana Editor
de datos designada. Si desea obtener ms informacin, consulte Tratamiento bsico de varios
orgenes de datos en Captulo 6 el p. 102.
Barra de estado
La barra de estado que aparece en la parte inferior de cada ventana de SPSS Statistics proporciona
la siguiente informacin:
Estado del comando. En cada procedimiento o comando que se ejecuta, un recuento de casos
indica el nmero de casos procesados hasta el momento. En los procedimientos estadsticos que
requieren procesamientos iterativos, se muestra el nmero de iteraciones.
Estado del filtro. Si ha seleccionado una muestra aleatoria o un subconjunto de casos para el
anlisis, el mensaje Filtrado indica que existe algn tipo de filtrado activado actualmente y por
tanto en el anlisis no se incluyen todos los casos del archivo de datos.
Estado de ponderacin. El mensaje Ponderado indica que se est utilizando una variable de
ponderacin para ponderar los casos para el anlisis.
Estado de divisin del archivo. El mensaje Segmentado indica que el archivo de datos se ha
segmentado en diferentes grupos para su anlisis en funcin de los valores de una o ms variables
de agrupacin.
Cuadros de dilogo
La mayora de las opciones de los mens acceden a un cuadro de dilogo cuando se seleccionan.
Los cuadros de dilogo se utilizan para seleccionar variables y opciones para el anlisis.
Los cuadros de dilogo para los procedimientos estadsticos tienen normalmente dos componentes
bsicos:
Lista de variables de origen. Una lista de variables en el conjunto de datos activo. En la lista
de origen slo aparecen los tipos de variables que el procedimiento seleccionado permite.
La utilizacin de variables de cadena corta y de cadena larga est restringida en muchos
procedimientos.
Listas de variables de destino. Una o varias listas que indican las variables elegidas para el anlisis;
7
Resumen
Para controlar los atributos de presentacin por defecto de las variables en las listas de origen,
elija Opciones en el men Editar. Si desea obtener ms informacin, consulte General:
Opciones en Captulo 48 el p. 526.
Para cambiar los atributos de presentacin de las listas de variables de origen dentro de un
cuadro de dilogo, pulse con el botn derecho del ratn en una variable de la lista de origen y
seleccione los atributos de presentacin en el men contextual. Puede mostrar los nombres
o las etiquetas de variable (los nombres se muestran para cualquier variable sin etiquetas
definidas) y puede ordenar la lista de origen por orden de archivo, orden alfabtico o nivel
de medida. Si desea obtener ms informacin sobre el nivel de medida, consulte Iconos de
tipo de datos, nivel de medida y lista de variables el p. 8.
Figura 1-2
Etiquetas de variable mostradas en un cuadro de dilogo
8
Captulo 1
pega en la ventana de sintaxis. A continuacin, puede personalizar los comandos con funciones
adicionales que no se encuentran disponibles en los cuadros de dilogo.
Restablecer. Desactiva las variables en las listas de variables seleccionadas y restablece todas las
especificaciones del cuadro de dilogo y los subcuadros de dilogo al estado por defecto.
Cancelar. Cancela los cambios que se realizaron en las selecciones del cuadro de dilogo desde la
ltima vez que se abri y lo cierra. Durante una sesin se mantienen las selecciones del cuadro de
dilogo. El cuadro de dilogo retiene el ltimo conjunto de especificaciones hasta que se anulan.
Ayuda. Proporciona ayuda contextual. Este control le lleva a una ventana de Ayuda con
Seleccin de variables
Para seleccionar una nica variable, simplemente seleccinela en la lista de variables de origen
y arrstrela y colquela en la lista de variables de destino. Tambin puede utilizar el botn de
direccin para mover las variables de la lista de origen a las listas de destino. Si slo existe una
lista de variables de destino, puede pulsar dos veces en las variables individuales para desplazarlas
desde la lista de origen hasta la de destino.
Tambin pueden seleccionar diversas variables:
Para seleccionar varias variables que estn agrupadas en la lista de variables, pulse en la
primera de ellas y, a continuacin, en la ltima del grupo mientras mantiene pulsada la tecla
Mays.
Para seleccionar varias variables que no estn agrupadas en la lista de variables, pulse en la
primera de ellas; a continuacin, pulse en la siguiente variable mientras mantiene pulsada la
tecla Ctrl, y as sucesivamente (en Macintosh, mantenga pulsada la tecla Comando).
Tipo de datos
Numrico
Escala
Cadena
n/a
Fecha
Tiempo
9
Resumen
Ordinal
Nominal
Si desea obtener ms informacin sobre los tipos de dato numrico, cadena, fecha y hora,
consulte Tipo de variable el p. 80.
o crear un grfico.
Seleccionar las variables para el anlisis. Las variables del archivo de datos se muestran en un
10
Captulo 1
Asesor estadstico
Si no est familiarizado con SPSS Statistics o con los procedimientos estadsticos disponibles,
el Asesor estadstico puede ayudarle solicitndole informacin mediante preguntas simples,
utilizando un lenguaje no tcnico y ejemplos visuales que le ayudarn a seleccionar las funciones
estadsticas y los grficos ms apropiados para sus datos.
Para utilizar el Asesor estadstico, elija en los mens de cualquier ventana de SPSS Statistics:
?
Asesor estadstico
El Asesor estadstico cubre slo un subconjunto selecto de procedimientos del sistema Base.
Est diseado para proporcionar una asistencia general para muchas de las tcnicas estadsticas
bsicas que se utilizan habitualmente.
Informacin adicional
Si desea obtener una introduccin global ms detallada a los conceptos bsicos, consulte el tutorial
en pantalla. En cualquier men de SPSS Statistics, elija:
?
Tutorial
Captulo
Obtencin de ayuda
Temas. Proporciona acceso a las pestaas Contenido, ndice y Buscar, que pueden usarse
Tutorial. Instrucciones ilustradas paso a paso sobre cmo utilizar muchas de las funciones
bsicas. No necesita consultar el tutorial de principio a fin. Puede elegir los temas que desea
consultar, pasar de un tema a otro, ver los temas en cualquier orden y utilizar el ndice o la
tabla de contenidos para buscar temas concretos.
Estudios de casos. Ejemplos prcticos sobre cmo crear diferentes tipos de anlisis estadsticos
y cmo interpretar los resultados. Tambin se proporcionan los archivos de datos de muestra
utilizados en estos ejemplos para que pueda trabajar en dichos ejemplos y observar con
exactitud cmo se generaron los resultados. Puede elegir los procedimientos concretos que
desee aprender en la tabla de contenidos o buscar los temas correspondientes en el ndice.
procedimiento que desea utilizar. Tras realizar una serie de selecciones, el Asesor estadstico
abre el cuadro de dilogo para el procedimiento estadstico, de generacin de informes o de
creacin de grficos que cumple los criterios seleccionados. El Asesor estadstico proporciona
acceso a la mayora de los procedimientos estadsticos y de generacin de informes en el
sistema Base y en los procedimientos de creacin de grficos.
contexto.
Botn Ayuda en los cuadros de dilogo. La mayora de los cuadros de dilogo disponen de un
botn Ayuda que permite acceder directamente al tema de ayuda correspondiente. Este tema
proporciona informacin general y vnculos a los temas relacionados.
11
12
Captulo 2
Ayuda en el men contextual de una tabla pivote. Pulse con el botn derecho del ratn en los
http://support.spss.com. (El sitio Web de servicio tcnico requiere un ID de inicio de sesin y una
contrasea. La informacin sobre cmo obtener el ID y la contrasea se facilita en la direccin
URL mencionada anteriormente.)
Developer Central. Developer Central incluye recursos para todos los niveles de usuarios y
Captulo
Archivos de datos
Los archivos de datos pueden tener formatos muy diversos, y este programa se ha sido diseado
para trabajar con muchos de ellos, incluyendo:
Tablas de bases de datos de diferentes orgenes de bases de datos, incluido Oracle, SQLServer,
Access, dBASE, entre otros
Archivos de texto delimitados por tabuladores y otros tipos de archivos de slo texto
Archivos de datos con formato SPSS Statistics creados en otros sistemas operativos.
En el anlisis en modo distribuido donde un servidor remoto procesa los comandos y ejecuta
los procedimientos, las unidades, carpetas y archivos de datos disponibles dependen de lo que
est disponible en el servidor remoto. En la parte superior del cuadro de dilogo se indica el
nombre del servidor actual. Slo tendr acceso a los archivos de datos del equipo local si
especifica la unidad como un dispositivo compartido y las carpetas que contienen los archivos
de datos como carpetas compartidas. Si desea obtener ms informacin, consulte Anlisis
en modo distribuido en Captulo 4 el p. 68.
14
Captulo 3
E En el cuadro de dilogo Abrir datos, seleccione el archivo que desea abrir.
E Pulse en Abrir.
Si lo desea, puede:
Leer los nombres de las variables de la primera fila de los archivos de hoja de clculo.
Especificar el rango de casillas que desee leer en los archivos de hojas de clculo.
Especificar una hoja de trabajo dentro de un archivo de Excel que desee leer (Excel 95
o versiones posteriores).
Si desea obtener informacin sobre la lectura de datos de bases de datos, consulte Lectura de
archivos de bases de datos el p. 16. Si desea obtener informacin sobre la lectura de datos de
archivos de datos de texto, consulte Asistente para la importacin de texto el p. 30.
de archivos en este formato lleva mucho ms tiempo que guardarlos en formato SPSS Statistics.
Excel. Abre archivos de Excel.
Lotus 1-2-3. Abre archivos de datos guardados en formato 1-2-3 en las versiones 3.0, 2.0 o 1A
de Lotus.
SYLK. Abre archivos de datos guardados en formato SYLK (vnculo simblico), un formato
15
Archivos de datos
rangos de casillas utilice el mismo mtodo que emplear en la aplicacin de hoja de clculo.
perdido del sistema indicado por un punto (o una coma). En las variables de cadena, los espacios
en blanco son valores de cadena vlidos y las casillas en blanco se tratan como valores de cadena
vlidos.
Nombres de variable. Si lee la primera fila del archivo de Excel (o la primera fila del rango
especificado) como nombres de variable, los valores que no cumplan las normas de denominacin
de variables se convertirn en nombres de variables vlidos y los nombres originales se utilizarn
como etiquetas de variable. Si no lee nombres de variable del archivo de Excel, se asignarn
nombres de variable por defecto.
ancho de la columna y el tipo de datos de la primera casilla de la columna. Los valores de otro
tipo se convierten en valor perdido por el sistema. Si la primera casilla de datos de la columna
est en blanco, se utiliza el tipo de datos global por defecto para la hoja de clculo (normalmente
numrico).
Casillas en blanco. En las variables numricas, las casillas en blanco se convierten en el valor
perdido del sistema indicado por un punto (o una coma). En las variables de cadena, los espacios
en blanco son valores de cadena vlidos y las casillas en blanco se tratan como valores de cadena
vlidos.
16
Captulo 3
Nombres de variable. Si no se leen los nombres de variable de la hoja de clculo, se utilizan las
letras de las columnas (A, B, C,...) como nombres de variable de los archivos de Excel y de
Lotus. Para los archivos de SYLK y de Excel guardados en el formato de presentacin R1C1, el
programa utiliza para los nombres de variable el nmero de la columna precedido por la letra C
(C1, C2, C3,...).
Se incluyen los registros marcados para ser eliminados que an no se han purgado. El
programa crea una nueva variable de cadena, D_R, que incluye un asterisco en los casos
marcados para su eliminacin.
de SPSS Statistics en formato que distingue entre maysculas y minsculas. Los nombres
de variable de Stata que slo se diferencian en el uso de las maysculas y minsculas se
convierten en nombres de variable vlidos aadiendo un subrayado y una letra secuencial (_A,
_B, _C, ..., _Z, _AA, _AB, ..., etc.).
de SPSS Statistics.
Etiquetas de valor. Las etiquetas de valor de Stata se convierten en etiquetas de valor de SPSS
Statistics, excepto las etiquetas de valor de Stata asignadas a valores perdidos extendidos.
17
Archivos de datos
Aada un mensaje solicitando al usuario que introduzca datos para crear una consulta con
parmetros.
Para leer archivos de bases de datos con una consulta ODBC guardada
E Elija en los mens:
Archivo
Abrir base de datos
Ejecutar consulta...
E Seleccione el archivo de consulta (*.spq) que desee ejecutar.
E Si es necesario (segn el archivo de base de datos), introduzca un nombre de acceso y una
contrasea.
E Si la consulta tiene una solicitud incrustada, introduzca otra informacin necesaria (por ejemplo,
18
Captulo 3
Si no tiene configurado ningn origen de datos ODBC o si desea aadir uno nuevo, pulse en
Aadir origen de datos ODBC.
En los sistemas operativos Linux, este botn no est disponible. Los orgenes de datos ODBC
se especifican en odbc.ini y es necesario especificar las variables de entorno ODBCINI con la
ubicacin de dicho archivo. Si desea obtener ms informacin, consulte la documentacin de
los controladores de la base de datos.
En el anlisis en modo distribuido (disponible con SPSS Statistics Server), este botn no
est disponible. Para aadir orgenes de datos en el anlisis en modo distribuido, consulte
con el administrador del sistema.
Un origen de datos ODBC est compuesto por dos partes esenciales de informacin: el
controlador que se utilizar para acceder a los datos y la ubicacin de la base de datos a la que se
desea acceder. Para especificar los orgenes de datos, debern estar instalados los controladores
adecuados. Para el anlisis en modo local, puede instalar los controladores de varios formatos de
bases de datos desde el CD de instalacin de SPSS Statistics.
Figura 3-1
Asistente para bases de datos
19
Archivos de datos
Para acceder a los orgenes de datos OLE DB (slo disponibles en los sistemas operativos
Windows), debe tener instalados los siguientes elementos:
.NET framework
Las versiones de estos componentes compatibles con esta versin se pueden instalar desde el CD
de instalacin y estn disponibles en el men de reproduccin automtica.
Las uniones entre tablas no estn disponibles para los orgenes de datos OLE DB. Slo se
puede leer una tabla al mismo tiempo.
Se pueden aadir orgenes de datos OLE DB en anlisis en modo local. Para aadir orgenes
de datos OLE DB en el anlisis en modo distribuido en un servidor Windows, consulte con el
administrador del sistema.
En el anlisis en modo distribuido (disponible con SPSS Statistics Server), los orgenes de
datos OLE DB slo estn disponibles en servidores Windows, y debe tener instalado en el
servidor .NET, Dimensions Data Model y OLE DB Access.
Figura 3-2
Asistente para bases de datos con acceso a orgenes de datos OLE DB
20
Captulo 3
E En las propiedades del vnculo de datos, pulse en la pestaa Proveedor y seleccione el proveedor
OLE DB.
E Pulse en Siguiente o en la pestaa Conexin.
E Seleccione la base de datos introduciendo la ubicacin del directorio y el nombre de base de
datos o pulsando en el botn para desplazarse hasta una base de datos. (Puede que tambin sean
necesarios un nombre de usuario y una contrasea.)
E Pulse en Aceptar una vez que haya escrito toda la informacin necesaria. (Puede comprobar si la
base de datos especificada est disponible pulsando en el botn Probar conexin.)
E Escriba un nombre para la informacin de conexin de base de datos. (Este nombre se mostrar en
E Pulse en Aceptar.
Volver a la primera pantalla del Asistente para bases de datos, donde puede seleccionar el nombre
guardado de la lista de orgenes de datos OLE DB y continuar con el siguiente paso del asistente.
Eliminacin de orgenes de datos OLE DB
Para eliminar nombres de orgenes de datos de la lista de orgenes de datos OLE DB, elimine el
archivo UDL que contiene el nombre del origen de datos:
[unidad]:\Documents and Settings\[nombre de usuario]\Local Settings\Application
Data\SPSS\UDL
21
Archivos de datos
Figura 3-4
Asistente para bases de datos, seleccin de datos
Presentacin de los nombres de los campos. Para ver los campos de la tabla, pulse en el signo ms
(+) situado a la izquierda del nombre de una tabla. Para ocultar los campos pulse en el signo
menos () situado a la izquierda del nombre de una tabla.
Para aadir un campo. Pulse dos veces en cualquier campo de la lista Tablas disponibles o
arrstrelo hasta la lista Recuperar los campos en este orden. Los campos se pueden volver a
ordenar arrastrndolos y colocndolos dentro de la lista de campos.
Para eliminar un campo. Pulse dos veces en cualquier campo de la lista Recuperar los campos en
Por defecto, la lista muestra slo las tablas disponibles de bases de datos estndar. Puede controlar
el tipo de elementos que se muestran en la lista:
Vistas. Las vistas son tablas virtuales o dinmicas definidas por consultas. Estas tablas
pueden incluir uniones de varias tablas y/o campos derivados de clculos basados en los
valores de otros campos.
Sinnimos. Un sinnimo es un alias para una tabla o vista que suele estar definido en una
consulta.
Tablas del sistema. Las tablas del sistema definen propiedades de la base de datos. En algunos
casos, las tablas de base de datos estndar pueden estar clasificadas como tablas del sistema y
slo se mostrarn si se selecciona esta opcin. El acceso a tablas del sistema reales suele estar
limitado a los administradores de la base de datos.
22
Captulo 3
Nota: para los orgenes de datos OLE DB (slo disponibles en los sistemas operativos Windows),
nicamente puede seleccionar los campos de una sola tabla. Las uniones entre varias tablas no son
compatibles con los orgenes de datos OLE DB.
Establecimiento de relaciones. Para crear una relacin, arrastre un campo desde cualquier tabla
hasta el campo con el que quiera unirlo. El Asistente para bases de datos dibujar una lnea de
unin entre los dos campos que indica su relacin. Estos campos deben ser del mismo tipo
de datos.
Unir tablas automticamente. Intenta unir las tablas automticamente en funcin de las claves
primarias/externas o de los nombres de campo y tipos de datos coincidentes.
Tipo de unin. Si el controlador permite uniones exteriores, podr especificar uniones interiores,
Uniones interiores. Una unin interior incluye slo las filas donde los campos relacionados
son iguales. En este ejemplo, se incluirn todas las filas con los mismos valores de ID en
las dos tablas.
Uniones exteriores. Adems de las coincidencias de uno a uno con uniones interiores, tambin
puede utilizar uniones exteriores para fusionar tablas con un esquema de coincidencia de uno
a varios. Por ejemplo, puede hacer una coincidencia con una tabla donde slo hay algunos
23
Archivos de datos
registros que representan los valores de datos y las etiquetas descriptivas asociadas, con
valores en una tabla que contiene cientos o miles de registros que representan los encuestados.
Una unin exterior izquierda incluye todos los registros de la tabla izquierda y slo aquellos
registros de la tabla derecha en los que los campos relacionados son iguales. En una unin
exterior derecha, se importan todos los registros de la tabla derecha y slo aquellos registros
de la tabla izquierda en los que los campos relacionados son iguales.
La mayora de los criterios utiliza al menos uno de los seis operadores de relacin (<, >,
<=, >=, = y <>).
Figura 3-6
Asistente para bases de datos, limitacin de recuperacin de casos
24
Captulo 3
Para crear sus criterios necesita por lo menos dos expresiones y una relacin para conectarlas.
E Para crear una expresin, seleccione uno de los siguientes mtodos:
En una celda Expresin, puede escribir nombres de campo, constantes, operadores aritmticos,
funciones numricas y de otro tipo, y variables lgicas.
E Para elegir el operador relacional (como = o >), site el cursor en la casilla Relacin y escriba el
Los literales de fecha y hora (marcas de hora) se deben especificar usando el formato general
{ts 'aaaa-mm-dd hh:mm:ss'}.
El valor completo de fecha y/o hora debe ir entre comillas simples. Los aos se deben expresar
en formato de cuatro dgitos y las fechas y horas deben contener dos dgitos para cada parte
del valor. Por ejemplo, 1 de enero de 2005, 1:05 AM se expresara como:
{ts '2005-01-01 01:05:00'}
Funciones. SPSS ofrece una seleccin de funciones preincorporadas SQL aritmticas, lgicas, de
cadena, de fecha y de hora. Puede arrastrar una funcin de la lista hasta la expresin, o introducir
una funcin SQL vlida. Consulte la documentacin de la base de datos para obtener funciones
SQL vlidas. Hay una lista de funciones estndar disponibles en:
http://msdn2.microsoft.com/en-us/library/ms711813.aspx
Utilizar muestreo aleatorio. Esta opcin selecciona una muestra aleatoria de casos del origen de
datos. Para grandes orgenes de datos, es posible que desee limitar el nmero de casos a una
pequea y representativa muestra, lo que reduce considerablemente el tiempo de ejecucin de
procesos. Si el muestreo aleatorio original se encuentra disponible para el origen de datos, resulta
ms rpido que el muestreo aleatorio de SPSS Statistics dado que SPSS Statistics an debe leer
todo el origen de datos para extraer una muestra aleatoria.
indicado. Dado que esta rutina toma una decisin pseudoaleatoria para cada caso, el
porcentaje de casos seleccionados slo se puede aproximar al especificado. Cuantos ms
casos contenga el archivo de datos, ms se acercar el porcentaje de casos seleccionados
al porcentaje especificado.
Exactamente. Selecciona una muestra aleatoria con el nmero de casos especificado a partir
del nmero total de casos especificado. Si el nmero total de casos especificado supera el
nmero total de casos presentes en el archivo de datos, la muestra contendr un nmero menor
de casos proporcional al nmero solicitado.
25
Archivos de datos
Nota: Si utiliza el muestreo aleatorio, agregacin (disponible en el modo distribuido con SPSS
Statistics Server) no estar disponible.
Pedir el valor al usuario. Permite insertar una solicitud en la consulta para crear una consulta con
parmetros. Cuando un usuario ejecute la consulta, se le solicitar que introduzca los datos
(segn lo que se haya especificado aqu). Puede interesarle esta opcin si necesita obtener
diferentes vistas de los mismos datos. Por ejemplo, es posible que desee ejecutar la misma
consulta para ver las cifras de ventas de diversos trimestres fiscales.
E Site el cursor en cualquier casilla de expresin y pulse en Pedir el valor al usuario para crear
una peticin.
Para crear una solicitud, introduzca una cadena de peticin y un valor por defecto. Esta cadena
aparecer cada vez que un usuario ejecute la consulta. La cadena especificar el tipo de
informacin que debe introducir. Si la informacin no se ofrece en una lista, la cadena sugerir el
formato que debe aplicarse a la informacin. A continuacin se muestra un ejemplo: Introduzca un
trimestre (Q1, Q2, Q3, ...).
Permitir al usuario seleccionar el valor de la lista. Si selecciona esta casilla de verificacin, puede
limitar las elecciones del usuario a los valores que incluya en esta lista. Asegrese de que los
valores se separan por retornos de carro.
Tipo de datos. Seleccione aqu el tipo de datos (Nmero, Cadena o Fecha).
26
Captulo 3
Adicin de Datos
Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con el servidor
SPSS Statistics), podr agregar los datos antes de leerlos en SPSS Statistics.
Figura 3-9
Asistente para bases de datos, agregacin de datos
Tambin se pueden agregar los datos despus de leerlos en SPSS Statistics, pero si lo hace antes
ahorrar tiempo en el caso de grandes orgenes de datos.
E Para crear datos agregados, seleccione una o ms variables de segmentacin que definan cmo
27
Archivos de datos
Definicin de variables
Nombres y etiquetas de variables. El nombre completo del campo (columna) de la base de datos
Si el nombre del campo de la base de datos forma un nombre de variable vlido y nico, se
usar como el nombre de la variable.
para convertir automticamente una variable de cadena en una variable numrica. Los valores de
cadena se convierten en valores enteros consecutivos en funcin del orden alfabtico de los valores
originales. Los valores originales se mantienen como etiquetas de valor para las nuevas variables.
Anchura para los campos de ancho variable. Esta opcin controla la anchura de los valores de las
cadenas de anchura variable. Por defecto, la anchura es de 255 bytes y slo se leen los primeros
255 bytes (generalmente 255 caracteres en idiomas de un solo byte). El valor mximo que se
puede asignar a este parmetro es de 32.767 bytes. Aunque posiblemente no desee truncar los
valores de cadena, tampoco desear especificar un valor innecesariamente alto, ya que producira
que el procesamiento fuera ineficaz.
Minimizar las longitudes de cadena en funcin de los valores observados. Establece automticamente
28
Captulo 3
Figura 3-10
Asistente para bases de datos, definicin de variables
Ordenacin de casos
Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con SPSS
Statistics Server), podr agregar los datos antes de leerlos en SPSS Statistics.
29
Archivos de datos
Figura 3-11
Asistente para bases de datos, ordenacin de casos
Tambin se pueden ordenar los datos despus de leerlos en SPSS Statistics, pero si lo hace antes
ahorrar tiempo en el caso de grandes orgenes de datos.
Resultados
El paso Resultados muestra la instruccin Select de SQL para la consulta.
Se puede editar la instruccin Select de SQL antes de ejecutar la consulta, pero si pulsa el
botn Anterior para introducir cambios en pasos anteriores, se perdern los cambios realizados
en la instruccin Select.
Para guardar la consulta para utilizarla ms adelante, utilice la seccin Guardar la consulta
en un archivo.
Para pegar la sintaxis GET DATA completa en una ventana de sintaxis, seleccione Pegarlo en
el editor de sintaxis para su modificacin ulterior. Copiar y pegar la instruccin Select de la
ventana Resultados no pegar la sintaxis de comandos necesaria.
Nota: La sintaxis pegada contiene un espacio en blanco delante de las comillas de cierre en cada
lnea de SQL generada por el asistente. Estos espacios no son superfluos. Cuando se procesa el
comando, todas las lneas de la instruccin SQL se fusionan de un modo muy literal. Si esos
espacios, los caracteres ltimo y primero de cada lnea se uniran.
30
Captulo 3
Figura 3-12
Asistente para bases de datos, panel de resultados
En los archivos delimitados, tambin se pueden especificar otros caracteres como delimitadores
entre valores, o bien especificar varios delimitadores diferentes.
31
Archivos de datos
E Siga los pasos indicados en el Asistente para la importacin de texto para definir cmo desea leer
El archivo de texto se mostrar en una ventana de vista previa. Puede aplicar un formato
predefinido (guardado con anterioridad desde el Asistente para la importacin de texto) o seguir
los pasos del asistente para especificar cmo desea que se lean los datos.
32
Captulo 3
Este paso ofrece informacin sobre las variables. Una de las variables es similar a uno de los
campos de la base de datos. Por ejemplo, cada elemento de un cuestionario es una variable.
Cmo estn organizadas sus variables? Para leer los datos adecuadamente, el Asistente para la
importacin de texto necesita saber cmo determinar el lugar en el que terminan los valores de
datos de una variable y comienzan los valores de datos de la variable siguiente. La organizacin
de las variables define el mtodo utilizado para diferenciar una variable de la siguiente.
Delimitado. Se utilizan espacios, comas, tabulaciones u otros caracteres para separar variables.
Las variables quedan registradas en el mismo orden para cada caso, pero no necesariamente
conservando la misma ubicacin para las columnas.
Ancho fijo. Cada variable se registra en la misma posicin de columna en el mismo registro
(lnea) para cada caso del archivo de datos. No se requiere delimitador entre variables De
hecho, en muchos archivos de datos de texto generados por programas de ordenador, podra
parecer que los valores de los datos se suceden, sin espacios que los separen. La ubicacin de
la columna determina qu variable se est leyendo.
Estn incluidos los nombres de las variables en la parte superior del archivo? Si la primera fila del
archivo de datos contiene etiquetas descriptivas para cada variable, podr utilizar dichas etiquetas
como nombres de las variables. Los valores que no cumplan las normas de denominacin de
variables se convertirn en nombres de variables vlidos.
33
Archivos de datos
Este paso ofrece informacin sobre los casos. Un caso es similar a un registro de una base de
datos. Por ejemplo, cada persona que responde a un cuestionario es un caso.
En qu nmero de lnea comienza el primer caso de datos? Indica la primera lnea del archivo de
datos que contiene valores de datos. Si la lnea o lneas superiores del archivo de datos contienen
etiquetas descriptivas o cualquier otro texto que no represente valores de datos, dicha lnea o
lneas no sern la lnea 1.
Cmo se representan sus casos? Controla la manera en que el Asistente para la importacin de
texto determina dnde finaliza cada caso y comienza el siguiente.
Cada lnea representa un caso. Cada lnea contiene un slo caso. Es bastante comn que cada
lnea (fila) contenga un slo caso, aunque dicha lnea puede ser muy larga para un archivo de
datos con un gran nmero de variables. Si no todas las lneas contienen el mismo nmero
de valores de datos, el nmero de variables para cada caso quedar determinado por la lnea
que tenga el mayor nmero de valores de datos. A los casos con menos valores de datos se
les asignarn valores perdidos para las variables adicionales.
cada caso informa al Asistente para la importacin de texto de dnde detener la lectura de un
caso y comenzar la del siguiente. Una misma lnea puede contener varios casos y los casos
pueden empezar en medio de una lnea y continuar en la lnea siguiente. El Asistente para
la importacin de texto determina el final de cada caso basndose en el nmero de valores
ledos, independientemente del nmero de lneas. Cada caso debe contener valores de datos
(o valores perdidos indicados por delimitadores) para todas las variables; de otra forma, el
archivo de datos no se leer correctamente.
34
Captulo 3
Cuntos casos desea importar? Puede importar todos los casos del archivo de datos, los primeros
n casos (siendo n un nmero especificado por el usuario) o una muestra aleatoria a partir de
un porcentaje especificado. Dado que esta rutina de muestreo aleatorio toma una decisin
pseudo-aleatoria para cada caso, el porcentaje de casos seleccionados slo se puede aproximar
al porcentaje especificado. Cuantos ms casos contenga el archivo de datos, ms se acercar el
porcentaje de casos seleccionados al porcentaje especificado.
Este paso ofrece informacin sobre los casos. Un caso es similar a un registro de una base de
datos. Por ejemplo, cada encuestado es un caso.
En qu nmero de lnea comienza el primer caso de datos? Indica la primera lnea del archivo de
datos que contiene valores de datos. Si la lnea o lneas superiores del archivo de datos contienen
etiquetas descriptivas o cualquier otro texto que no represente valores de datos, dicha lnea o
lneas no sern la lnea 1.
Cuntas lneas representan un caso? Controla la manera en que el Asistente para la importacin
de texto determina dnde finaliza cada caso y comienza el siguiente. Cada variable queda definida
por su nmero de lnea dentro del caso y por la ubicacin de su columna. Para leer los datos
correctamente, deber especificar el nmero de lneas de cada caso.
Cuntos casos desea importar? Puede importar todos los casos del archivo de datos, los primeros
n casos (siendo n un nmero especificado por el usuario) o una muestra aleatoria a partir de
un porcentaje especificado. Dado que esta rutina de muestreo aleatorio toma una decisin
pseudo-aleatoria para cada caso, el porcentaje de casos seleccionados slo se puede aproximar
35
Archivos de datos
Este paso muestra la mejor opcin, segn el Asistente para la importacin de texto, para leer el
archivo de datos y le permite modificar la manera en que el asistente leer las variables del archivo
de datos.
Qu delimitador desea para la separacin entre variables? Indica los caracteres o smbolos que
separan los valores de datos. Puede seleccionar cualquier combinacin de espacios, comas, signos
de punto y coma, tabulaciones o cualquier otro carcter. En caso de existir varios delimitadores
consecutivos sin valores de datos, dichos delimitadores sern considerados valores perdidos.
Cul es el calificador de texto? Caracteres utilizados para encerrar valores que contienen
caracteres delimitadores. Por ejemplo, si una coma es el delimitador, los valores que contengan
comas se leern incorrectamente a menos que estos valores se encierre en un calificador de texto,
impidiendo que las comas del valor se interpreten como delimitadores entre los valores. Los
archivos de datos con formato CSV de Excel utilizan las comillas dobles () como calificador
de texto. El calificador de texto aparece tanto al comienzo como al final del valor, encerrndolo
completamente.
36
Captulo 3
Este paso muestra la mejor opcin, segn el Asistente para la importacin de texto, para leer
el archivo de datos y le permite modificar la manera en que el asistente leer las variables del
archivo de datos. Las lneas verticales de la ventana de vista previa indican el lugar en el que en
ese momento el Asistente para la importacin de texto piensa que cada variable comienza en
el archivo.
Inserte, mueva y elimine lneas de ruptura de variable segn convenga para separar variables.
Si se utilizan varias lneas para cada caso, los datos aparecern como una lnea para cada caso y
las lneas posteriores se adjuntarn al final de la lnea.
Notas:
En archivos de datos generados por ordenador que producen un flujo continuo de valores de datos
sin espacios ni otras caractersticas distintivas, puede resultar difcil determinar el lugar en el que
comienza cada variable. Los archivos de datos del tipo citado anteriormente suelen depender de
un archivo de definicin de datos u otro tipo de descripcin escrita que especifique la ubicacin
por lneas y columnas de cada variable.
37
Archivos de datos
Este paso controla el nombre de la variable y el formato de datos que el Asistente para la
importacin de texto utilizar para leer cada variable, as como las que se incluirn en el archivo
de datos definitivo.
Nombre de variable. Puede sobrescribir los nombres de variable por defecto y sustituirlos por otros
diferentes. Si lee nombres de variable desde el archivo de datos, el Asistente para la importacin
de texto modificar de manera automtica los nombres de variable que no cumplan las normas de
denominacin de variables. Seleccione una variable en la ventana de vista previa e introduzca un
nombre de variable.
Formato de datos. Seleccione una variable en la ventana de vista previa y, a continuacin,
seleccione un formato de la lista desplegable. Pulse el botn del ratn con la tecla MAYS
presionada para seleccionar una serie de variables consecutivas, o bien con la tecla CTRL
presionada para seleccionar una serie de variables no consecutivas.
decimal.
38
Captulo 3
Cadena. Son valores vlidos prcticamente todos los caracteres del teclado y los espacios en
blanco incrustados. En los archivos delimitados, puede especificar hasta un mximo de 32.767 de
caracteres para el valor. El Asistente para la importacin de texto fija como valor por defecto para
el nmero de caracteres el valor de cadena ms largo que se haya encontrado para la variable o
variables seleccionadas. Para los archivos de ancho fijo, el nmero de caracteres en los valores de
cadena queda definido por la ubicacin de las lneas de ruptura de variable en el paso 4.
Fecha/hora. Entre los valores vlidos se encuentran las fechas con formato general: dd-mm-aaaa,
mm/dd/aaaa, dd.mm.aaaa, aaaa/mm/dd, hh:mm:ss, as como una amplia variedad de formatos de
hora y fecha. Los meses se pueden representar en dgitos, nmeros romanos, abreviaturas de tres
letras o con el nombre completo. Seleccione un formato de fecha de la lista.
Dlar. Los valores vlidos son nmeros con un signo dlar inicial optativo y puntos separadores de
39
Archivos de datos
Este es el paso final del Asistente para la importacin de texto. Puede guardar sus propias
especificaciones en un archivo para hacer uso de ellas cuando importe archivos de datos de texto
similares. Tambin puede pegar la sintaxis generada por el Asistente para la importacin de texto
en una ventana de sintaxis. As podr personalizar y/o guardar dicha sintaxis para utilizarla en
futuras sesiones o en trabajos de produccin.
Cach local de los datos. Una cach de datos es una copia completa del archivo de datos
almacenada en un espacio de disco temporal. La cach del archivo de datos puede mejorar
el rendimiento.
.NET framework
Las versiones de estos componentes compatibles con esta versin se pueden instalar desde el
CD de instalacin y estn disponibles en el men de reproduccin automtica. Slo puede
aadir orgenes de datos de Dimensions en el anlisis en modo local. Esta caracterstica no est
disponible en el anlisis en modo distribuido con el servidor de SPSS Statistics.
Para leer datos de un origen de datos de Dimensions:
E En cualquiera de las ventanas de SPSS Statistics abiertas, elija en los mens:
Archivo
Abrir datos de dimensiones
E En la pestaa Propiedades de vnculo de datos: Conexin, especifique el archivo de metadatos, el
40
Captulo 3
Tipo de datos de casos. El formato del archivo de datos de casos. Los formatos disponibles
incluyen:
Archivo de datos de Quancept (DRS). Datos del caso en un archivo Quancept .drs, .drz o .dru.
Base de datos de Quanvert. Datos del caso en una base de datos de Quanvert.
Base de datos de Dimensions (MS SQL Server). Datos de casos en una base de datos
relacional de investigacin de mercado en SQL Server. Esta opcin se puede utilizar para leer
los datos recopilados mediante mrInterview.
Ubicacin de datos de casos. El archivo que contiene los datos de casos. El formato de este archivo
debe ser coherente con el tipo de datos de casos seleccionado.
Figura 3-21
Propiedades de vnculo de datos: Pestaa Conexin
Nota: no se sabe hasta qu punto el resto de opciones de la pestaa Conexin o cualquier opcin
del resto de pestaas Propiedades de vnculo de datos pueden afectar a la lectura de datos de
Dimensions en SPSS Statistics, por lo que se recomienda no cambiar ninguna de ellas.
Mostrar variables del sistema. Muestra cualquier variable de sistema, incluidas las variables
que indican el estado de encuesta (en curso, finalizada, fecha de finalizacin, etc.). A
continuacin, puede seleccionar cualquier variable de sistema que desee incluir. Por defecto,
se excluyen todas las variables del sistema.
41
Archivos de datos
Mostrar variables de cdigos. Muestra cualquier variable que represente cdigos que se
utilizan para respuestas Otros abiertas para variables categricas. A continuacin, puede
seleccionar cualquier variable de cdigos que desee incluir. Por defecto, se excluyen todas
las variables de cdigos.
Mostrar variables de archivo de origen. Muestra cualquier variable que contenga nombres de
Finalizada correctamente
Activa / en curso
Tiempo agotado
42
Captulo 3
Fecha de inicio. Se incluyen los casos para los que se complet la recopilacin de datos
Fecha de finalizacin. Se incluyen los casos para los que se complet la recopilacin de datos
antes de la fecha especificada. No se incluyen los casos para los que la recopilacin de datos
se complet en la fecha de finalizacin.
Si especifica tanto una fecha de inicio como una fecha de finalizacin, se definir un rango de
fechas de finalizacin desde la fecha de inicio hasta la fecha de finalizacin (sta ltima no
incluida).
Figura 3-23
Importacin de datos de dimensiones: pestaa Seleccin de casos
43
Archivos de datos
Esta informacin se almacena en la parte del diccionario sobre el archivo de datos. El Editor
de datos proporciona una forma de presentar la informacin sobre la definicin de la variable.
Tambin se puede mostrar la informacin completa del diccionario para el conjunto de datos
activo o para cualquier otro archivo de datos.
Para mostrar informacin sobre los archivos de datos
E Seleccione en los mens de la ventana Editor de datos:
Archivo
Mostrar informacin del archivo de datos
E Para el archivo de datos abierto actualmente, elija Archivo de trabajo.
E Para otros archivos de datos, elija Archivo externo y seleccione el archivo de datos.
SAS
Stata
44
Captulo 3
E Elija en los mens:
Archivo
Guardar como...
E Seleccione un tipo de archivo de la lista desplegable.
E Introduzca un nombre de archivo para el nuevo archivo de datos.
Para escribir nombres de variable en la primera fila de una hoja de clculo o de un archivo de datos
delimitados por tabuladores:
E Pulse en Escribir nombres de variable en hoja de clculo en el cuadro de dilogo Guardar datos como.
Para guardar las etiquetas de valor en lugar de los valores de los datos en archivos Excel:
E Pulse en Guardar etiquetas de valor donde se hayan definido en vez de valores de datos en el cuadro
Si desea obtener informacin sobre la exportacin de datos a tablas de base de datos, consulte
Exportacin a base de datos el p. 50.
Si desea obtener informacin sobre la exportacin de datos para utilizarlos en aplicaciones de
Dimensions, consulte Exportacin a Dimensions el p. 63.
Los archivos de datos guardados con formato SPSS Statistics no se pueden leer en versiones
anteriores a la 7.5. Los archivos de datos guardados en modo Unicode no se pueden leer en
versiones de SPSS Statistics anteriores a la 16.0.Si desea obtener ms informacin, consulte
General: Opciones en Captulo 48 el p. 526.
Al utilizar archivos de datos con nombres de variable con longitud superior a ocho bytes en
10.x u 11.x, se utilizan versiones nicas de ocho bytes de los nombres de variable, pero se
mantienen los nombres originales de las variables para su utilizacin en la versin 12.0 o
posterior. En versiones anteriores a la 10.0, los nombres largos originales de las variables
se pierden si se guarda el archivo de datos.
Al utilizar archivos de datos con variables de cadena con ms de 255 bytes en versiones
anteriores a la versin 13.0, dichas variables de cadena se fragmentan en variables de cadena
de 255 bytes.
45
Archivos de datos
Versin 7.0 (*.sav). Formato de la versin 7.0. Los archivos de datos guardados con formato de
la versin 7.0 se pueden leer en la versin 7.0 y en versiones anteriores, pero no incluyen los
conjuntos de respuestas mltiples definidos ni la informacin sobre la introduccin de datos
para Windows.
SPSS/PC+ (*.sys). Formato SPSS/PC+. Si el archivo de datos contiene ms de 500 variables, slo
se guardarn las 500 primeras. Para las variables con ms de un valor definido como perdido por
el usuario, los valores definidos como perdidos por el usuario adicionales se recodificarn en
el primero de estos valores.
SPSS Statistics SPSS porttil (*.por). El formato porttil puede leerse en otras versiones de SPSS
Statistics y en versiones para otros sistemas operativos. Los nombres de variable se limitan a ocho
bytes, y se convertirn a nombres nicos de ocho bytes si es preciso. En la mayora de los casos,
ya no es necesario guardar los datos en formato porttil, ya que los archivos de datos en formato
SPSS Statistics deberan ser independientes de la plataforma y del sistema operativo. No se puede
guardar los archivos de datos en un archivo porttil en modo Unicode. Si desea obtener ms
informacin, consulte General: Opciones en Captulo 48 el p. 526.
Delimitado por tabulaciones (*.dat). Archivos de texto con valores separados por tabuladores.
(Nota: Los tabuladores incrustados en los valores de cadena se conservarn como tabuladores
en el archivo delimitado por tabuladores. No se realiza ninguna distincin entre los tabuladores
incrustados en los valores y los tabuladores que separan los valores.)
Delimitado por comas (*.csv). Archivos de texto con valores separados por comas o puntos y coma.
Si el indicador decimal actual de SPSS Statistics es un punto, los valores se separan mediante
comas. Si el indicador decimal actual es una coma, los valores se separan mediante punto y coma.
ASCII en formato fijo (*.dat). Archivos de texto con formato fijo, utilizando los formatos de
escritura por defecto para todas las variables. No existen tabuladores ni espacios entre los campos
de variable.
Excel 2007 (*.xlsx). Libro de trabajo con formato XLSX de Microsoft Excel 2007. El nmero
mximo de variables es 16.000, el resto de variables adicionales por encima de esa cifra se
eliminan. Si el conjunto de datos contiene ms de un milln de casos, se crean varias hojas
en el libro de trabajo.
Excel 97 hasta 2003 (*.xls). Libro de trabajo de Microsoft Excel 97. El nmero mximo de variables
es 256, el resto de variables adicionales por encima de esa cifra se eliminan. Si el conjunto de
datos contiene ms de 65.356 casos, se crean varias hojas en el libro de trabajo.
Excel 2.1(*.xls). Archivo de hoja de clculo de Microsoft Excel 2.1. El nmero mximo de
46
Captulo 3
Excel 2.1 y Excel 97 tienen un lmite de 256 columnas; por lo tanto, slo se incluyen las
primeras 256 variables.
Excel 2007 tiene un lmite de 16.000 columnas; por lo tanto, slo se incluyen las primeras
16.000 variables.
Excel 2.1 tiene un lmite de 16.384 filas; por lo tanto, slo se incluyen los primeros 16.384
casos.
Excel 97 y Excel 2007 tienen un nmero limitado de filas por hoja, pero como los libros de
trabajo pueden tener mltiples hojas, se crean ms cuando se excede el mximo de cada hoja.
47
Archivos de datos
Tipos de variables
La siguiente tabla muestra la relacin del tipo de las variables entre los datos originales de SPSS
Statistics y los datos exportados a Excel.
SPSS Statistics Tipo de variable
Numrico
Coma
Dlar
$#,##0_); ...
Fecha
d-mmm-aaaa
Hora
hh:mm:ss
Cadena
General
Algunos caracteres que se permiten en los nombres de variables de SPSS Statistics no son
vlidos en SAS, como por ejemplo @, # y $. Al exportar los datos, estos caracteres no vlidos
se reemplazan por un carcter de subrayado.
Los nombres de variable de SPSS Statistics que contienen caracteres de varios bytes (por
ejemplo, caracteres japoneses o chinos) se convierten en nombres de variable con formato
general Vnnn, dondennn es un valor entero.
SAS slo permite que exista un valor perdido del sistema, mientras que SPSS Statistics
permite que haya varios valores perdidos del sistema. Por tanto, todos los valores perdidos del
sistema en SPSS Statistics se asignan a un nico valor perdido del sistema en el archivo SAS.
Existe la posibilidad de guardar los valores y las etiquetas de valor asociadas al archivo de datos
en un archivo de sintaxis de SAS. Por ejemplo, al exportar las etiquetas de valor del archivo de
datos coches.sav , el archivo de sintaxis generado contiene:
libname library '\name\' ;
proc format library = library ;
value ORIGIN /* Pas de origen */
1 = 'EE.UU.'
2 = 'Europa'
48
Captulo 3
3 = 'Japn' ;
value CYLINDER /* Nmero de cilindros */
3 = '3 cilindros'
4 = '4 cilindros'
5 = '5 cilindros'
6 = '6 cilindros'
8 = '8 cilindros' ;
value FILTER__ /* cylrec = 1 | cylrec = 2 (FILTER) */
0 = 'No seleccionado'
1 = 'Seleccionado' ;
proc datasets library = library ;
modify cars;
format
ORIGIN ORIGIN.;
format
CYLINDER CYLINDER.;
format
FILTER__ FILTER__.;
quit;
La siguiente tabla muestra la relacin del tipo de las variables entre los datos originales de SPSS
Statistics y los datos exportados a SAS.
SPSS Statistics Tipo de variable Tipo de variable de SAS
Numrico
Numrico
12
Coma
Numrico
12
Puntos
Numrico
12
Notacin cientfica
Numrico
12
Fecha
Numrico
Fecha (Hora)
Numrico
Hora18
Dlar
Numrico
12
Moneda personalizada
Numrico
12
Cadena
Carcter
$8
Los datos pueden escribirse en formato Stata 58, as como en formato Intercooled y SE
(slo en las versiones 7 y 8).
Los archivos de datos que se guardan en formato Stata 5 se pueden leer con Stata 4.
49
Archivos de datos
Los primeros 80 bytes de etiquetas de variable se guardan como etiquetas de variable Stata.
Para variables numricas, los primeros 80 bytes de etiquetas de valor se guardan como
etiquetas de variable Stata. Para las variables de cadena, las etiquetas de valor se excluyen.
Para las versiones 7 y 8, los primeros 32 bytes de nombres de variable en formato que
distingue entre maysculas y minsculas se guardan como nombres de variable Stata. Para
versiones anteriores, los primeros ocho bytes de nombres de variable se guardan como
nombres de variable Stata. Cualquier carcter distinto de letras, nmero y caracteres de
subrayado se convierten en caracteres de subrayado.
Los nombres de variable de SPSS Statistics que contienen caracteres de varios bytes (por
ejemplo, caracteres japoneses o chinos) se convierten en nombres de variables con formato
general Vnnn, dondennn es un valor entero.
Para las versiones 56 y las versiones Intercooled 78, se guardan los primeros 80 bytes de
valores de cadena. Para Stata SE 78, se guardan los primeros 244 bytes de valores de cadena.
Para las versiones 56 y las versiones Intercooled 78, slo se guardan los primeros 2.047
bytes de valores de cadena. Para Stata SE 78, slo se guardan las primeras 32.767 variables.
Numrico
Coma
Numrico
Puntos
Numrico
Notacin cientfica
Numrico
Date*, Momento_fecha
Numrico
D_m_Y
Tiempo, Tiempo_fecha
Numrico
g (nmero de segundos)
Dia_semana
Numrico
g (17)
Mes
Numrico
Dlar
Numrico
g (112)
g
Moneda personalizada
Numrico
Cadena
Cadena
50
Captulo 3
El cuadro de dilogo Guardar datos como: Variables permite seleccionar las variables que desea
guardar en el nuevo archivo de datos. Por defecto, se almacenarn todas las variables. Anule
la seleccin de las variables que no desea guardar o pulse en Eliminar todo y, a continuacin,
seleccione aquellas variables que desea guardar.
Slo visibles. Selecciona slo variables de conjuntos de variables que se usan actualmente. Si
desea obtener ms informacin, consulte Utilizar conjuntos de variables en Captulo 47 el p. 522.
Para guardar un subconjunto de variables
E Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).
E En los mens, seleccione:
Archivo
Guardar como...
E Pulse en Variables.
E Seleccione las variables que desee almacenar.
Reemplazar los valores de los campos (columnas) de la tabla de la base de datos existente o
aadir nuevos campos a una tabla.
Reemplazar completamente una tabla de base de datos o crear una tabla nueva.
51
Archivos de datos
Al crear nuevos campos (aadiendo campos a una tabla de base de datos existente, creando
una tabla nueva o reemplazando una tabla), puede especificar los nombres de campo, el tipo de
datos y el ancho (donde corresponda).
Nombre de campo. Los nombres de campo por defecto son los mismos que los nombres de variable
de SPSS Statistics. Puede cambiar los nombres de campo a cualquier nombre permitido por el
formato de la base de datos. Por ejemplo, muchas bases de datos admiten que los nombres de
los campos contengan caracteres que no se permiten en los nombres de variable, incluidos los
espacios. Por tanto, un nombre de variable como EsperaLlamada puede cambiarse a un nombre
de campo Espera de llamada.
Tipo. El asistente para la exportacin realiza las asignaciones iniciales de los tipos de datos segn
los tipos de datos ODBC estndar o los tipos de datos admitidos por el formato de la base de datos
seleccionada que ms se parezca al formato de datos SPSS Statistics definido. No obstante, las
bases de datos puede realizar distinciones de tipos que no tenga equivalente directo en SPSS
Statistics y viceversa. Por ejemplo, la mayora de los valores numricos de SPSS Statistics se
almacenan como valores en punto flotante con doble precisin, mientras que los tipos de datos
numricos de las bases de datos incluyen nmeros flotantes (doble), enteros, reales, etc. Adems,
muchas bases de datos no tienen equivalentes a los formatos de tiempo de SPSS Statistics. Puede
cambiar el tipo de datos a cualquiera de los disponibles en la lista desplegable.
Como norma general, el tipo de datos bsico (de cadena o numricos) de la variable debe
coincidir con el tipo de datos bsico del campo de la base de datos. Si existe alguna discrepancia
de tipo de datos que la base de datos no pueda resolver, se producir un error y los datos no se
exportarn a la base de datos. Por ejemplo, si exporta una variable de cadena a un campo de la
base de datos con un tipo de datos numrico, se producir un error si algn valor de la variable
de cadena contiene caracteres no numricos.
Amplitud. Puede cambiar el ancho definido de los tipos de campo de cadena (char, varchar). Los
52
Captulo 3
Por defecto, los formatos de las variables de SPSS Statistics se asignan a tipos de campo de la
base de datos en funcin del siguiente esquema general. Los tipos de campo de la base de datos
reales pueden variar dependiendo de la base de datos.
Formatos de las variables SPSS Statistics
Numrico
Flotante o doble
Coma
Flotante o doble
Puntos
Flotante o doble
Notacin cientfica
Flotante o doble
Fecha
Momento_fecha
Tiempo, Tiempo_fecha
Dia_semana
Entero (17)
Mes
Entero (112)
Dlar
Flotante o doble
Moneda personalizada
Flotante o doble
Cadena
Char or Varchar
Existen dos opciones para el tratamiento de los valores perdidos definidos por el usuario cuando
los datos de las variables se exportan a campos de bases de datos:
Exportar como valores vlidos. Los valores perdidos definidos por el usuario se tratan como
Exportar valores numricos definidos como perdidos por el usuario como nulos y exportar
valores de cadena definidos como perdidos por el usuario como espacios en blanco. Los
valores numricos definidos como perdidos por el usuario reciben el mismo tratamiento que
los valores perdidos del sistema. Los valores definidos como perdidos por el usuario se
convierten en espacios en blanco (las cadenas no pueden ser valores perdidos del sistema).
53
Archivos de datos
Figura 3-25
Asistente para la exportacin a base de datos, seleccin de un origen de datos
Puede exportar datos a cualquier origen de base de datos para el que tenga el controlador ODBC
adecuado. (Nota: no se admite la exportacin a orgenes de datos OLE DB.)
Si no tiene configurado ningn origen de datos ODBC o si desea aadir uno nuevo, pulse en
Aadir origen de datos ODBC.
En los sistemas operativos Linux, este botn no est disponible. Los orgenes de datos ODBC
se especifican en odbc.ini y es necesario especificar las variables de entorno ODBCINI con la
ubicacin de dicho archivo. Si desea obtener ms informacin, consulte la documentacin de
los controladores de la base de datos.
En el anlisis en modo distribuido (disponible con SPSS Statistics Server), este botn no
est disponible. Para aadir orgenes de datos en el anlisis en modo distribuido, consulte
con el administrador del sistema.
Un origen de datos ODBC est compuesto por dos partes esenciales de informacin: el
controlador que se utilizar para acceder a los datos y la ubicacin de la base de datos a la que se
desea acceder. Para especificar los orgenes de datos, debern estar instalados los controladores
adecuados. Para el anlisis en modo local, puede instalar los controladores de varios formatos de
bases de datos desde el CD de instalacin de SPSS Statistics.
Algunos orgenes de datos pueden requerir un ID de acceso y una contrasea antes de poder
continuar con el siguiente paso.
54
Captulo 3
Las siguientes opciones estn disponibles para exportar datos a una base de datos:
Reemplazar los valores de los campos existentes. Reemplaza los valores de los campos
seleccionados en una tabla existente con valores de las variables seleccionadas en el conjunto
de datos activo. Si desea obtener ms informacin, consulte Sustitucin de los valores de los
campos existentes el p. 58.
Aadir nuevos campos a una tabla existente. Crea nuevos campos en una tabla existente que
contiene los valores de las variables seleccionadas en el conjunto de datos activo. Si desea
obtener ms informacin, consulte Adicin de nuevos campos el p. 59. Esta opcin no
est disponible para los archivos de Excel.
Aadir nuevos registros a una tabla existente. Aade nuevos registros (filas) a una tabla
existente que contiene los valores de los casos del conjunto de datos activo. Si desea obtener
ms informacin, consulte Adicin de nuevos registros (casos) el p. 60.
Eliminar una tabla existente y crear una tabla nueva con el mismo nombre. Elimina la
tabla especificada y crea una nueva tabla con el mismo nombre que contiene variables
seleccionadas del conjunto de datos activo. Toda la informacin de la tabla original, incluidas
las definiciones de las propiedades del campo (como las claves primarias o los tipos de
55
Archivos de datos
datos) se pierde. Si desea obtener ms informacin, consulte Creacin de una nueva tabla o
sustitucin de una tabla el p. 61.
Crear una tabla nueva. Crea una tabla nueva en la base de datos que contiene datos de las
Por defecto, la lista muestra slo las tablas de bases de datos estndar. Puede controlar el tipo de
elementos que se muestran en la lista:
Vistas. Las vistas son tablas virtuales o dinmicas definidas por consultas. Estas tablas
pueden incluir uniones de varias tablas y/o campos derivados de clculos basados en los
valores de otros campos. Puede aadir registros o reemplazar valores de campos existentes en
vistas, pero es posible que los campos que se pueden modificar estn limitados dependiendo
de cmo est estructurada la vista. Por ejemplo, no se puede modificar un campo derivado,
aadir campos a una vista ni reemplazar una vista.
56
Captulo 3
Sinnimos. Un sinnimo es un alias para una tabla o vista que suele estar definido en una
consulta.
Tablas del sistema. Las tablas del sistema definen propiedades de la base de datos. En algunos
casos, las tablas de base de datos estndar pueden estar clasificadas como tablas del sistema y
slo se mostrarn si se selecciona esta opcin. El acceso a tablas del sistema reales suele estar
limitado a los administradores de la base de datos.
Si desea obtener informacin sobre la definicin de una condicin de filtrado para la seleccin de
casos, consulte Seleccionar casos el p. 195.
En la base de datos, el campo o conjunto de campos que identifica de forma nica cada registro
suele estar designado como la clave primaria.
57
Archivos de datos
Debe identificar las variables correspondientes a los campos de clave primaria u otros campos
que identifican de manera nica a cada registro.
Los campos no tienen que ser la clave primaria de la base de datos, sin embargo, el valor de
campo o la combinacin de los valores de campo deben ser exclusivos para cada caso.
Para casar las variables con los campos de la base de datos que identifican cada registro de forma
nica:
E arrastre y coloque las variables en los campos correspondientes de la base de datos.
o
E Seleccione una variable de la lista de variables, seleccione el campo correspondiente en la tabla de
la base de datos y pulse en Conectar.
Nota: los nombres de variable y los nombres de los campos de la base de datos es posible que no
sean idnticos (ya que los nombres de la base de datos pueden contener caracteres que no admiten
los nombres de variable de SPSS Statistics), pero si el conjunto de datos activo se cre a partir de
la tabla de base de datos que est modificando, los nombres de variable o las etiquetas de variable
normalmente sern como mnimo similares a los nombres de campo de la base de datos.
58
Captulo 3
datos correspondiente.
Figura 3-30
Asistente para la exportacin a base de datos, sustitucin de los valores de los campos existentes
Como norma general, el tipo de datos bsico (de cadena o numricos) de la variable debe
coincidir con el tipo de datos bsico del campo de la base de datos. Si existe alguna
discordancia de tipos de datos que la base de datos no pueda resolver, se producir un error y
no se exportar ningn dato a la base de datos. Por ejemplo, si exporta una variable de cadena
a un campo de la base de datos con un tipo de datos numrico (por ejemplo, doble, real,
entero), se producir un error si algn valor de la variable de cadena contiene caracteres no
numricos. La letra a del icono situado junto a una variable denota una variable de cadena.
No se puede modificar el nombre, el tipo ni la anchura del campo. Los atributos del campo de
la base de datos originales se conservan, slo se reemplazan los valores.
59
Archivos de datos
Si desea obtener informacin sobre los nombres de campo y los tipos de datos, consulte la seccin
sobre la creacin de campos de bases de datos a partir de las variables de SPSS Statistics en
Exportacin a base de datos el p. 50.
Mostrar los campos existentes. Seleccione esta opcin para mostrar una lista de campos existentes.
No puede utilizar este panel en el Asistente para la exportacin a base de datos para reemplazar
campos existentes, pero puede resultar til saber los campos que ya estn presentes en la tabla.
Si desea reemplazar los valores de los campos existentes, consulte Sustitucin de los valores
de los campos existentes el p. 58.
60
Captulo 3
El Asistente para la exportacin a base de datos seleccionar automticamente todas las variables
que coincidan con los campos existentes utilizando la informacin sobre la tabla de base de
datos original almacenada en el conjunto de datos activo (si est disponible) y/o los nombres de
las variables que coinciden con los nombres de campo. Este emparejamiento inicial automtico
slo pretende ser una gua y permite cambiar la forma en que se hacen coincidir variables con los
campos de la base de datos.
Al aadir nuevos registros a una tabla existente, se aplican las siguientes reglas y limitaciones
bsicas:
Todos los casos (o todos los casos seleccionados) en el conjunto de datos activo se aaden
a la tabla. Si alguno de estos casos duplica los registros existentes en la base de datos,
puede producirse un error si se encuentra un valor de clave duplicado. Si desea obtener
informacin sobre la exportacin slo de los casos seleccionados, consulte Seleccin de
casos para exportar el p. 56.
61
Archivos de datos
Puede utilizar los valores de las variables nuevas creadas en la sesin como los valores de
los campos existentes, pero no puede aadir campos nuevos ni cambiar los nombres de los
existentes. Para aadir campos nuevos a una tabla de base de datos, consulte Adicin de
nuevos campos el p. 59.
Cualquier campo de la base de datos excluido que no coincida con una variable no tendr
ningn valor para los registros aadidos a la tabla de base de datos. (Si la casilla Origen de
valores est vaca, no habr ninguna variable que coincida con el campo.)
Clave primaria. Para designar variables como la clave primaria de la tabla de base de datos, marque
62
Captulo 3
Todos los valores de la clave primaria deben ser nicos, de lo contrario, se producir un error.
Si selecciona una nica variable como la clave primaria, cada registro (caso) debe tener
un valor nico para esa variable.
Si selecciona varias variables como clave primaria, esto define una clave primaria compuesta
y la combinacin de valores para las variables seleccionadas debe ser nica para cada caso.
Si desea obtener informacin sobre los nombres de campo y los tipos de datos, consulte la seccin
sobre la creacin de campos de bases de datos a partir de las variables de SPSS Statistics en
Exportacin a base de datos el p. 50.
Informacin de resumen
Conjunto de datos. El nombre de sesin de SPSS Statistics para el conjunto de datos que
se utilizar para exportar datos. Esta informacin es til principalmente si existen varios
orgenes de datos abiertos. Los orgenes de datos abiertos mediante la interfaz grfica de
usuario (por ejemplo, el Asistente para base de datos) tienen asignados automticamente
nombres como Conjunto_de_datos1, Conjunto_de_datos2, etc. Un origen de datos abierto
mediante sintaxis de comandos slo tendr un nombre de conjunto de datos si se ha asignado
alguno explcitamente.
63
Archivos de datos
Casos para exportar. Se pueden exportar todos los casos o los seleccionados por un filtro
Accin. Indica cmo se modificar la base de datos (por ejemplo, crear una tabla nueva, aadir
Valores definidos como perdidos por el usuario. Los valores definidos como perdidos por el
usuario se pueden exportar como valores vlidos o se pueden tratar como valores perdidos del
sistema para las variables numricas y convertirlos en espacios en blanco para las variables
de cadena. Este ajuste se controla en el panel en el que se seleccionan las variables que se
van a exportar.
Exportacin a Dimensions
El cuadro de dilogo Exportar a Dimensions crea un archivo de datos SPSS Statistics y un
archivo de metadatos de Dimensions que puede utilizar para leer los datos en las aplicaciones
de Dimensions, como mrInterview y mrTables. Resulta particularmente til cuando los datos
van y vienen entre las aplicaciones de Dimensions y SPSS Statistics. Por ejemplo, puede leer
un origen de datos de mrInterview en SPSS Statistics, calcular algunas nuevas variables y, a
continuacin, guardar los datos en un formato que mrTables pueda leer sin perder ninguno de los
atributos de metadatos originales.
Para exportar datos que se van a utilizar en aplicaciones de Dimensions:
E En los mens de la ventana del Editor de datos correspondientes al conjunto de datos que contiene
Statistics.
E Pulse en Archivo de metadatos para especificar el nombre y la ubicacin del archivo de datos
de Dimensions.
64
Captulo 3
Figura 3-35
Cuadro de dilogo Exportar a Dimensions
Para nuevas variables y conjuntos de datos no creados a partir de orgenes de datos de Dimensions,
los atributos de variable de SPSS Statistics se asignan a atributos de metadatos de Dimensions
en el archivo de metadatos siguiendo los mtodos descritos en la documentacin de SAV DSC
en la biblioteca de desarrollo de Dimensions.
Si el conjunto de datos activo se ha creado a partir de un origen de datos de Dimensions:
El nuevo archivo de metadatos se crea fusionando los atributos de metadatos originales con los
atributos de metadatos de todas las nuevas variables, adems de todos los cambios realizados
a las variables originales que puedan afectar a sus atributos de metadatos (por ejemplo,
adicin o cambios de las etiquetas de variable).
Para las variables originales ledas del origen de datos de Dimensions, todos los atributos
de metadatos no reconocidos por SPSS Statistics se conservan en su estado original. Por
ejemplo, SPSS Statistics convierte las variables de cuadrcula en variables de SPSS Statistics
normales, pero los metadatos que definen dichas variables de cuadrculas se conservan al
guardar el nuevo archivo de metadatos.
La presencia o ausencia de etiquetas de valor puede afectar a los atributos de metadatos de las
variables y, por tanto, a la manera en que dichas variables son ledas por las aplicaciones de
Dimensions. Si se han definido etiquetas de valor para algn valor que no sea perdido de una
variable, debern definirse para todos los valores que no sean perdidos de dicha variable ya que,
de no ser as, Dimensions eliminar los valores no etiquetados al leer el archivo de datos.
65
Archivos de datos
E En los mens del Editor de datos, elija:
Archivo
Marcar archivo como de slo lectura
66
Captulo 3
Las acciones que crean una o ms columnas de datos en espacio temporal en disco son:
Las acciones que crean una copia completa del archivo de datos en espacio temporal en disco son:
La ejecucin de procedimientos que ordenan los datos (por ejemplo, Ordenar casos,
Segmentar archivo)
La activacin de otras aplicaciones de SPSS Statistics que leen el archivo de datos (por
ejemplo, AnswerTree, DecisionTime)
Nota: El comando GET DATA proporciona una funcionalidad comparable a DATA LIST, sin crear
una copia completa del archivo de datos en el espacio temporal del disco. El comando SPLIT
FILE de la sintaxis de comandos no ordena el archivo de datos y por lo tanto no crea una copia
del archivo de datos. Este comando, sin embargo, necesita tener los datos ordenados para un
funcionamiento apropiado y la interfaz del cuadro de dilogo para este procedimiento ordenar de
forma automtica el archivo de datos, con la consiguiente copia completa de dicho archivo. En la
versin para estudiantes no est disponible la sintaxis de comandos.
Acciones que crean una copia completa del archivo de datos por defecto:
El Asistente para la importacin de texto proporciona un ajuste opcional para crear de forma
automtica una cach de los datos. Por defecto, se selecciona esta opcin. Para desactivar esta
opcin, simplemente desmarque la casilla de verificacin Cach local de los datos. En el Asistente
para bases de datos puede pegar la sintaxis de comando generada y eliminar el comando CACHE.
67
Archivos de datos
Si se dispone de suficiente espacio en disco en el ordenador que realiza el anlisis (el ordenador
local o el servidor remoto), se pueden eliminar varias consultas SQL y mejorar el tiempo de
procesamiento mediante la creacin de una cach de datos del archivo activo. La cach de datos
es una copia temporal de todos los datos.
Nota: Por defecto, el Asistente para bases de datos crea de forma automtica una cach de datos,
pero si se utiliza el comando GET DATA en la sintaxis de comandos para leer una base de datos,
no se crear una cach de datos de forma automtica. En la versin para estudiantes no est
disponible la sintaxis de comandos.
Un origen de datos est bloqueado y no se puede actualizar por nadie hasta que finalice la
sesin actual, abra un origen de datos diferente o haga una cach de los datos.
realizados en el archivo de datos activo antes de crear una cach del archivo).
E En los mens de la ventana de sintaxis, elija:
Ejecutar
Todos
Nota: El ajuste de la cach no se almacena entre sesiones. Cada vez que se inicia una nueva
sesin, se toma el valor por defecto de la opcin que es 20.
Captulo
Tareas que requieren un gran consumo de memoria. Cualquier tarea que tarde bastante tiempo
en el anlisis en modo local ser una buena candidata para el anlisis distribuido.
El anlisis distribuido slo afecta a las tareas relacionadas con los datos, como lectura de datos,
transformacin de datos, clculo de nuevas variables y clculo de estadsticos. El anlisis
distribuido no tiene ningn efecto sobre tareas relacionadas con la edicin de resultados, como la
manipulacin de tablas pivote o la modificacin de grficos.
Nota: El anlisis distribuido est disponible slo si ambos equipos tienen una versin local y
acceso a una versin de servidor con licencia del software instalado en un servidor remoto.
Acceso al servidor
El cuadro de dilogo Acceso al servidor permite seleccionar el ordenador para procesar comandos
y ejecutar procedimientos. Puede seleccionar el ordenador local o un servidor remoto.
68
69
Anlisis en modo distribuido
Figura 4-1
Cuadro de dilogo Acceso al servidor
Se pueden aadir, modificar o eliminar servidores remotos de la lista. Los servidores remotos
requieren normalmente un ID de usuario y una contrasea; tambin puede ser necesario un nombre
de dominio. Pngase en contacto con el administrador del sistema para obtener informacin
acerca de servidores, ID de usuario y contraseas, nombres de dominio disponibles y dems
informacin necesaria para la conexin.
Puede seleccionar un servidor por defecto y guardar el ID de usuario, nombre de dominio y
contrasea asociados a cualquier servidor. De esta manera, se conectar de forma automtica al
servidor por defecto en el momento de iniciar la sesin.
Si tiene licencia para utilizar SPSS Adaptor para Predictive Enterprise Services y tiene instalado
Predictive Enterprise Services 3.5 o posterior, puede pulsar en Buscar... para ver una lista de los
servidores disponibles en su red. Si no ha iniciado sesin en Predictive Enterprise Repository, se
le solicitar que introduzca la informacin de conexin antes de poder ver la lista de servidores.
70
Captulo 4
Figura 4-2
Cuadro de dilogo Configuracin del acceso al servidor
Para obtener una lista de servidores disponibles, los nmeros de puerto para dichos servidores y
toda la informacin adicional necesaria para la conexin, pngase en contacto con el administrador
del sistema. No utilice el Nivel de socket seguro a menos que lo indique el administrador.
Nombre del servidor. Un nombre de servidor puede ser un nombre alfanumrico asignado a un
ordenador (por ejemplo, ServidorRed) o una direccin IP nica asignada a un ordenador (por
ejemplo, 202.123.456.78).
Nmero de puerto. El nmero de puerto es el puerto que el software del servidor utiliza para
las comunicaciones.
Descripcin. Puede introducir una descripcin opcional para que se visualice en la lista de
servidores.
Conectar con Nivel de socket seguro. Las encriptaciones de Nivel de socket seguro (SSL) requieren
el anlisis distribuido cuando se envan al servidor remoto. Antes de utilizar el SSL, consulte con
el administrador. Para que esta opcin se active, SSL debe estar configurado en su equipo de
escritorio y en el servidor.
Nota: De esta manera, se conectar de forma automtica al servidor por defecto en el momento
de iniciar la sesin.
Para cambiar a otro servidor:
E Seleccione el servidor de la lista.
E Introduzca el ID de usuario, nombre de dominio y contrasea (si es necesario).
71
Anlisis en modo distribuido
Nota: Al cambiar de servidor durante una sesin, se cierran todas las ventanas abiertas. Se
solicitar guardar los cambios antes de que se cierren las ventanas.
Para aadir un servidor:
E Solicite al administrador la informacin de conexin del servidor.
E Pulse en Aadir para abrir el cuadro de dilogo Configuracin del acceso al servidor.
E Introduzca la informacin de conexin y la configuracin opcional y pulse en Aceptar.
Nota: la capacidad para buscar servidores disponibles slo est disponible si tiene licencia para
utilizar Adaptor para Enterprise Services y en su empresa se ejecuta Predictive Enterprise Services
3.5 o posterior.
E Pulse en Buscar... para abrir el cuadro de dilogo Buscar servidores. Si no ha iniciado sesin en
72
Captulo 4
Seleccione uno o ms servidores y pulse en Aceptar para aadirlos al cuadro de dilogo Acceso
al servidor. Aunque es posible aadir servidores manualmente al cuadro de dilogo Acceso al
servidor, la opcin de bsqueda de servidores disponibles permite conectar con los servidores
sin necesidad de conocer el nombre correcto y nmero de puerto del servidor. Esta informacin
se proporciona automticamente. No obstante, deber disponer de la informacin de inicio de
sesin correcta, como nombre de usuario, dominio y contrasea.
En el anlisis en modo distribuido, slo tendr acceso a los archivos del equipo local si
especifica la unidad como un dispositivo compartido y las carpetas que contienen los archivos
de datos como carpetas compartidas. Consulte la documentacin de su sistema operativo para
obtener informacin sobre cmo compartir carpetas del equipo local con la red del servidor.
Si el servidor est ejecutando un sistema operativo diferente (por ejemplo, usted dispone de
Windows y el servidor se ejecuta bajo UNIX), probablemente no dispondr de acceso a
los archivos de datos locales en el anlisis en modo distribuido, aunque los archivos estn
en carpetas compartidas.
los archivos de datos, las carpetas y las unidades que ve en el cuadro de dilogo de acceso a los
archivos (para la apertura de archivos de datos) es similar a lo que ve en otras aplicaciones o en el
Explorador de Windows. Se pueden ver todos los archivos de datos y las carpetas en el ordenador
y cualquier archivo y carpeta en las unidades de red.
Anlisis en modo distribuido. Cuando utiliza otro ordenador como servidor remoto para ejecutar
comandos y procedimientos, la visualizacin de los archivos de datos y las unidades representa
la vista desde el servidor remoto. Aunque vea nombres de carpetas que le son familiares (como
Archivos de programas y unidades como C), estas no son las carpetas y unidades del ordenador
local, sino las del servidor remoto.
73
Anlisis en modo distribuido
Figura 4-4
Vistas de los equipos local y remoto
En el anlisis en modo distribuido, slo tendr acceso a los archivos de datos del equipo local si
especifica la unidad como un dispositivo compartido y las carpetas que contienen los archivos de
datos como carpetas compartidas. Si el servidor est ejecutando un sistema operativo diferente
(por ejemplo, usted dispone de Windows y el servidor se ejecuta bajo UNIX), probablemente no
dispondr de acceso a los archivos de datos locales en el anlisis en modo distribuido, aunque
los archivos estn en carpetas compartidas.
El anlisis en modo distribuido no es lo mismo que acceder a archivos de datos que se
encuentran en otro ordenador de la red. Se puede acceder a archivos de datos en otros dispositivos
de red tanto en anlisis en modo local como en anlisis en modo distribuido. En modo local, se
accede a otros dispositivos desde el ordenador local. En el modo distribuido, se accede a otros
dispositivos de red desde el servidor remoto.
Si no est seguro de si est utilizando el anlisis en modo local o distribuido, mire la barra de
ttulo en el cuadro de dilogo para acceder a archivos de datos. Si el ttulo del cuadro de dilogo
contiene la palabra remoto (como en Abrir archivo remoto) o si el texto Servidor remoto: [nombre del
servidor] aparece en la parte superior del cuadro de dilogo, significa que est en modo distribuido.
Nota: Esta situacin afecta slo a los cuadros de dilogo para acceder a archivos de datos (por
ejemplo, Abrir datos, Guardar datos, Abrir base de datos y Aplicar diccionario de datos). Para
todos los dems tipos de archivos (por ejemplo, archivos del Visor, archivos de sintaxis y archivos
de procesos) se utiliza la visualizacin local.
74
Captulo 4
Si utiliza la versin de servidor para Windows, puede usar las especificaciones de la UNC
(convencin de denominacin universal) al acceder a los archivos de datos y sintaxis mediante la
sintaxis de comandos. El formato general de una especificacin UNC es:
\\nombre_servidor\nombre_compartido\ruta\nombre_archivo
Si el ordenador no tiene un nombre asignado, puede utilizar su direccin IP, como en:
GET FILE = '\\204.125.125.53\public\julio\ventas.sav'.
Incluso con especificaciones de ruta de acceso UNC, slo se puede acceder a archivos de datos y
de sintaxis que estn en carpetas y dispositivos compartidos. Cuando se utiliza anlisis en modo
distribuido, esta situacin incluye archivos de datos y de sintaxis del ordenador local.
Especificaciones de rutas absolutas para UNIX
En las versiones de servidor para UNIX, no hay un equivalente a las rutas UNC y todas las rutas
de acceso de los directorios deben ser rutas absolutas que comienzan en la raz del servidor; las
rutas relativas no estn permitidas. Por ejemplo, si el archivo de datos est ubicado en /bin/data
75
Anlisis en modo distribuido
Captulo
Editor de datos
El Editor de datos proporciona un mtodo prctico (al estilo de las hojas de clculo) para la
creacin y edicin de archivos de datos. La ventana Editor de datos se abre automticamente
cuando se inicia una sesin.
El Editor de datos proporciona dos vistas de los datos.
Vista de datos. Esta vista muestra los valores de datos reales o las etiquetas de valor definidas.
Vista de variables. Esta vista muestra la informacin de definicin de las variables, que incluye
las etiquetas de la variable definida y de valor, tipo de dato (por ejemplo, cadena, fecha o
numrico), nivel de medida (nominal, ordinal o de escala) y los valores perdidos definidos
por el usuario.
En ambas vistas, se puede aadir, modificar y eliminar la informacin contenida en el archivo
de datos.
Vista de datos
Figura 5-1
Vista de datos
Muchas de las funciones de la Vista de datos son similares a las que se encuentran en aplicaciones
de hojas de clculo. Sin embargo, existen varias diferencias importantes:
Las filas son casos. Cada fila representa un caso o una observacin. Por ejemplo, cada
individuo que responde a un cuestionario es un caso.
Las columnas son variables. Cada columna representa una variable o una caracterstica que se
mide. Por ejemplo, cada elemento en un cuestionario es una variable.
76
77
Editor de datos
Las casillas contienen valores. Cada casilla contiene un valor nico de una variable para
cada caso. La casilla se encuentra en la interseccin del caso y la variable. Las casillas slo
contienen valores de datos. A diferencia de los programas de hoja de clculo, las casillas del
Editor de datos no pueden contener frmulas.
El archivo de datos es rectangular. Las dimensiones del archivo de datos vienen determinadas
por el nmero de casos y de variables. Se pueden introducir datos en cualquier casilla. Si
introduce datos en una casilla fuera de los lmites del archivo de datos definido, el rectngulo
de datos se ampliar para incluir todas las filas y columnas situadas entre esa casilla y los
lmites del archivo. No hay casillas vacas en los lmites del archivo de datos. Para variables
numricas, las casillas vacas se convierten en el valor perdido del sistema. Para variables de
cadena, un espacio en blanco se considera un valor vlido.
Vista de variables
Figura 5-2
Vista de variables
La Vista de variables contiene descripciones de los atributos de cada variable del archivo de
datos. En la Vista de variables:
78
Captulo 5
Se pueden aadir o eliminar variables, y modificar los atributos de las variables, incluidos los
siguientes:
Nombre de variable
Tipo de datos
Nmero de decimales
Ancho de columna.
Nivel de medida
79
Editor de datos
Nombres de variable
Para los nombres de variable se aplican las siguientes normas:
Los nombres de variable pueden tener una longitud de hasta 64 bytes y el primer carcter
debe ser una letra o uno de estos caracteres: @, # o $. Los caracteres posteriores puede ser
cualquier combinacin de letras, nmeros, caracteres que no sean signos de puntuacin y un
punto (.). En el modo de pgina de cdigo, sesenta y cuatro bytes suelen equivaler a 64
caracteres en idiomas de un solo byte (por ejemplo, ingls, francs, alemn, espaol, italiano,
hebreo, ruso, griego, rabe y tailands) y 32 caracteres en los idiomas de dos bytes (por
ejemplo, japons, chino y coreano). Muchos caracteres de una cadena ocuparn un solo byte
en el modo de pgina de cdigo y dos o ms bytes en el modo Unicode. Por ejemplo, ocupa
un byte en el formato de pgina de cdigo pero dos bytes en el formato Unicode; por lo que
rsum ocupa seis bytes en un archivo de pgina de cdigo y ocho bytes en modo Unicode.
Nota: las letras incluyen todos los caracteres que no son signos de puntuacin y se utilizan al
escribir palabras normales en los idiomas admitidos en el juego de caracteres de la plataforma.
Un signo $ en la primera posicin indica que la variable es una variable del sistema. El signo
$ no se admite como carcter inicial de una variable definida por el usuario.
Se deben evitar los nombres de variable que terminan con un punto, ya que el punto puede
interpretarse como un terminador del comando. Slo puede crear variables que finalicen con
un punto en la sintaxis de comandos. No puede crear variables que terminen con un punto en
los cuadros de dilogo que permiten crear nuevas variables.
Se deben evitar los nombres de variable que terminan con un carcter de subrayado, ya que
tales nombres puede entrar en conflicto con los nombres de variable creados automticamente
por comandos y procedimientos.
Las palabras reservadas no se pueden utilizar como nombres de variable. Las palabras
reservadas son ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO y WITH.
Cuando es necesario dividir los nombres largos de variable en varias lneas en los resultados,
las lneas se dividen aprovechando los subrayados, los puntos y cuando el contenido cambia
de minsculas a maysculas.
80
Captulo 5
Nominal. Una variable se puede tratar como nominal si sus valores representan categoras que
Ordinal. Una variable puede tratarse como ordinal cuando sus valores representan categoras
con alguna ordenacin intrnseca (por ejemplo, los niveles de satisfaccin con un servicio,
que vayan desde muy insatisfecho hasta muy satisfecho). Entre los ejemplos de variables
ordinales se incluyen escalas de actitud que representan el grado de satisfaccin o confianza y
las puntuaciones de evaluacin de las preferencias.
Escala. Una variable puede ser tratada como escala cuando sus valores representan categoras
ordenadas con una mtrica con significado, por lo que son adecuadas las comparaciones de
distancia entre valores. Son ejemplos de variables de escala: la edad en aos y los ingresos
en dlares.
Nota: Para variables de cadena ordinales, se asume que el orden alfabtico de los valores de
cadena indica el orden correcto de las categoras. Por ejemplo, en una variable de cadena cuyos
valores sean bajo, medio, alto, se interpreta el orden de las categoras como alto, bajo, medio
(orden que no es el correcto). Por norma general, se puede indicar que es ms fiable utilizar
cdigos numricos para representar datos ordinales.
A las nuevas variables numricas creadas durante una sesin se les asigna un nivel de medida de
escala. Para los datos ledos de los formatos de archivo externos y los archivos de datos SPSS
Statistics creados antes de la versin 8.0, la asignacin del nivel de medida por defecto se basa en
las siguientes reglas:
Las variables numricas con menos de 24 valores nicos y las variables de cadena se
establecen en nominales.
Se puede cambiar el valor de corte de escala/nominal para las variables numricas en el cuadro de
dilogo Opciones. Si desea obtener ms informacin, consulte Datos: Opciones en Captulo 48
el p. 529.
El cuadro de dilogo Definir propiedades de variables, disponible en el men Datos, puede
ayudarle a asignar el nivel de medida correcto. Si desea obtener ms informacin, consulte
Asignacin del nivel de medida en Captulo 7 el p. 110.
Tipo de variable
Tipo de variable especifica los tipos de datos de cada variable. Por defecto se asume que todas las
variables nuevas son numricas. Se puede utilizar Tipo de variable para cambiar el tipo de datos.
El contenido del cuadro de dilogo Tipo de variable depende del tipo de datos seleccionado. Para
algunos tipos de datos, hay cuadros de texto para la anchura y el nmero de decimales; para otros
tipos de datos, simplemente puede seleccionar un formato de una lista desplegable de ejemplos.
81
Editor de datos
Figura 5-3
Cuadro de dilogo Tipo de variable
posiciones y con el punto como delimitador decimal. El Editor de datos acepta valores numricos
para este tipo de variables con o sin comas, o bien en notacin cientfica. Los valores no pueden
contener comas a la derecha del indicador decimal.
Punto. Una variable numrica cuyos valores se muestran con puntos que delimitan cada tres
posiciones y con la coma como delimitador decimal. El Editor de datos acepta valores numricos
para este tipo de variables con o sin puntos, o bien en notacin cientfica. Los valores no pueden
contener puntos a la derecha del indicador decimal.
Notacin cientfica. Una variable numrica cuyos valores se muestran con una E intercalada y
un exponente con signo que representa una potencia de base 10. El Editor de datos acepta para
estas variables valores numricos con o sin el exponente. El exponente puede aparecer precedido
por una E o una D con un signo opcional, o bien slo por el signo (por ejemplo, 123, 1,23E2,
1,23D2, 1,23E+2 y 1,23+2).
Fecha. Una variable numrica cuyos valores se muestran en uno de los diferentes formatos de
cada tres posiciones y un punto como delimitador decimal. Se pueden introducir valores de
datos con o sin el signo dlar inicial.
Moneda personalizada. Una variable numrica cuyos valores se muestran en uno de los formatos
de moneda personalizados que se hayan definido previamente en la pestaa Moneda del cuadro de
dilogo Opciones. Los caracteres definidos en la moneda personalizada no se pueden emplear en
la introduccin de datos pero s se mostrarn en el Editor de datos.
82
Captulo 5
Cadena. Una variable cuyos valores no son numricos y, por lo tanto, no se utilizan en los
clculos. Los valores pueden contener cualquier carcter siempre que no se exceda la longitud
definida. Las maysculas y las minsculas se consideran diferentes. Este tipo tambin se conoce
como variable alfanumrica.
Para formatos numricos, de coma y de punto, se pueden introducir valores con cualquier
nmero de dgitos decimales (hasta 16) y el valor completo se almacena internamente. La
Vista de datos muestra slo el nmero definido de dgitos decimales y redondea los valores
con ms decimales. Sin embargo, el valor completo se utiliza en todos los clculos.
Para las variables de cadena, todos los valores se rellenan por la derecha hasta el ancho
mximo. Para una variable de cadena con un ancho de tres, un valor de No se almacena
internamente como 'No ' y no es equivalente a ' No'.
Para formatos de fecha, se pueden utilizar guiones, barras, espacios, comas o puntos como
separadores entre valores de da, mes y ao; se pueden introducir nmeros, abreviaciones
de tres letras o nombres completos para el valor de mes. Las fechas del formato general
dd-mmm-aa aparecen separadas por guiones y con abreviaciones de tres letras para el
mes. Las fechas del formato general dd/mm/aa y mm/dd/aa se muestran con barras como
separadores y nmeros para el mes. Internamente, las fechas se almacenan como el nmero de
segundos transcurridos desde el 14 de octubre de 1582. El rango de siglo para fechas con aos
de dos dgitos est determinado por la configuracin de las opciones (en el men Edicin,
seleccione Opciones y, a continuacin, pulse en la pestaa Datos).
Para formatos de hora, se pueden utilizar dos puntos, puntos o espacios como separadores entre
horas, minutos y segundos. Las horas se muestran separadas por dos puntos. Internamente,
las horas se almacenan como el nmero de segundos que representa un intervalo de tiempo.
Por ejemplo, 10:00:00 se almacena internamente como 36000, que es 60 (segundos por
minuto) x 60 (minutos por hora) x 10 (horas).
Etiquetas de variable
Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud (128
caracteres en los idiomas de doble byte). Las etiquetas de variable pueden contener espacios y
caracteres reservados que no se admiten en los nombres de variable.
83
Editor de datos
Etiquetas de valor
Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es
especialmente til si el archivo de datos utiliza cdigos numricos para representar categoras que
no son numricas (por ejemplo, cdigos 1 y 2 para hombre y mujer).
Figura 5-4
Cuadro de dilogo Etiquetas de valor
84
Captulo 5
E Para etiquetas de variable, seleccione la casilla Etiqueta de la variable en la Vista de variables
El \n no aparece en las tablas pivote ni en los grficos; se interpreta como un carcter de salto de
lnea.
Valores perdidos
Valores perdidos define los valores de los datos definidos como perdidos por el usuario. Por
ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a
responder de los datos perdidos porque la pregunta no afecta a dicho encuestado. Los valores de
datos que se especifican como perdidos por el usuario aparecen marcados para un tratamiento
especial y se excluyen de la mayora de los clculos.
Figura 5-5
Cuadro de dilogo Valores perdidos
Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto, un rango de
valores perdidos o un rango ms un valor de tipo discreto.
Se considera que son vlidos todos los valores de cadena, incluidos los valores vacos o nulos,
a no ser que se definan explcitamente como perdidos.
Los valores perdidos de las variables de cadena no pueden tener ms de ocho bytes. (No hay
ningn lmite respecto al ancho definido de la variable de cadena, pero los valores definidos
como perdidos no pueden tener ms de ocho bytes.)
Para definir como perdidos los valores nulos o vacos de una variable de cadena, escriba un
espacio en blanco en uno de los campos debajo de la seleccin Valores perdidos discretos.
85
Editor de datos
E Introduzca los valores o el rango de valores que representen los datos perdidos.
Ancho de columna
Se puede especificar un nmero de caracteres para el ancho de la columna. Los anchos de columna
tambin se pueden cambiar en la Vista de datos pulsando y arrastrando los bordes de las columnas.
El ancho de columna para fuentes proporcionales se basa en el ancho medio de los caracteres.
Dependiendo de los caracteres utilizados en el valor, se mostrarn ms o menos caracteres
con el ancho especificado.
Alineacin de la variable
La alineacin controla la presentacin de los valores de los datos y/o de las etiquetas de valor en
la Vista de datos. La alineacin por defecto es a la derecha para las variables numricas y a la
izquierda para las variables de cadena. Este ajuste slo afecta a la presentacin en la Vista de datos.
Copiar un nico atributo (por ejemplo, etiquetas de valor) y pegarlo en la misma casilla de
atributo para una o ms variables.
Crear varias variables nuevas con todos los atributos de una variable copiada.
variables de destino.)
86
Captulo 5
E Elija en los mens:
Edicin
Pegar
Si pega el atributo en filas vacas, se crean nuevas variables con atributos por defecto para todos
los atributos excepto para el seleccionado.
Para aplicar todos los atributos de una variable definida
E En Vista de variables, seleccione el nmero de fila para la variable con los atributos que quiere
Los nombres de las nuevas variables se compondrn del prefijo especificado, ms un nmero
secuencial que comienza por el nmero indicado.
87
Editor de datos
de respuesta para las preguntas de encuesta (por ejemplo, seleccin nica, seleccin mltiple,
rellenar) o las frmulas empleadas para el clculo de variables.
Variables seleccionadas.
E Escriba el nombre del atributo. Los nombres de atributo deben cumplir las mismas reglas que los
todas las variables seleccionadas. Puede dejar este campo en blanco y especificar valores para
cada variable en la Vista de variables.
Figura 5-6
Cuadro de dilogo Nuevo atributo personalizado
Mostrar atributo en Editor de datos. Muestra el atributo en la Vista de variables del Editor de datos.
Si desea obtener informacin acerca del control de la presentacin de los atributos personalizados,
consulte Presentacin y edicin de los atributos de variable personalizados a continuacin.
Mostrar lista definida de atributos. Muestra una lista de atributos personalizados ya definidos para
el conjunto de datos. Los nombres de atributo que comienzan con un signo de dlar ($) son
atributos reservados que no es posible modificar.
88
Captulo 5
Los nombres de atributo que comienzan con un signo de dlar son reservados y no se pueden
modificar.
Una casilla en blanco indica que el atributo no existe para la variable; el texto Vaco mostrado
en una casilla indica que el atributo existe para dicha variable pero no se ha asignado ningn
valor al atributo de dicha variable. Una vez que se escribe texto en la casilla, existe el atributo
para dicha variable con el valor que ha introducido.
Si aparece el texto Matriz..., en una casilla, indica que se trata de una matriz de atributos, un
atributo que contiene varios valores. Pulse en el botn de la casilla para mostrar la lista
de valores.
89
Editor de datos
Figura 5-8
Personalizar Vista de variables
Una vez que los atributos aparecen en la Vista de variables, puede modificarlos directamente
en el Editor de datos.
90
Captulo 5
Todos los atributos de variable personalizados asociados al conjunto de datos aparecen entre
corchetes. Si desea obtener ms informacin, consulte Creacin de atributos de variable
personalizados el p. 87.
Los ajustes de presentacin personalizados se guardan en los archivos de datos con formato
SPSS Statistics.
Tambin puede controlar la presentacin por defecto y el orden de los atributos en la Vista de
variables. Si desea obtener ms informacin, consulte Cambio de la Vista de variables por
defecto en Captulo 48 el p. 531.
de los atributos.
Figura 5-10
Cuadro de dilogo Personalizar vista de variables
Restaurar las opciones por defecto. Aplica los ajustes por defecto de presentacin y orden.
91
Editor de datos
Revisin ortogrfica
Etiquetas de variable y de valor
contextual:
Ortografa
o
E En la Vista de variables, elija en los mens:
Utilidades
Ortografa
o
E En el cuadro de dilogo Etiquetas de valor, pulse en Ortografa. (Con esto, la revisin ortogrfica
Si no hay ninguna variable seleccionada en Vista de datos, se comprobarn todas las variables
de cadena.
Introduccin de datos
En la Vista de datos, puede introducir datos directamente en el Editor de datos. Se puede
introducir datos en cualquier orden. Asimismo, se pueden introducir datos por caso o por variable,
para reas seleccionadas o para casillas individuales.
92
Captulo 5
Cuando seleccione una casilla e introduzca un valor de datos, el valor se muestra en el editor
de casillas situado en la parte superior del Editor de datos.
Los valores de datos no se registran hasta que se pulsa Intro o se selecciona otra casilla.
Para introducir datos distintos de los numricos, en primer lugar, se debe definir el tipo de
variable.
Si introduce un valor en una columna vaca, el Editor de datos crear automticamente una nueva
variable y asignar un nombre de variable.
93
Editor de datos
Para variables de cadena, no se permiten los caracteres que sobrepasen el ancho definido.
Para variables numricas, se pueden introducir valores enteros que excedan el ancho definido,
pero el Editor de datos mostrar la notacin cientfica o una parte del valor seguido por puntos
suspensivos (...) para indicar que el valor es ms ancho que el ancho definido. Para mostrar el
valor de la casilla, cambie el ancho definido de la variable.
Nota: cambiar el ancho de la columna no afecta al ancho de la variable.
Edicin de datos
Con el Editor de datos es posible modificar un archivo de datos en Vista de datos de muchas
maneras. Tiene la posibilidad de:
Mover o copiar los valores de una nica variable (columna) a varias variables
94
Captulo 5
segundos si la casilla de destino es uno de los formatos numricos (por ejemplo, numrico, dlar,
de punto o de coma). Al almacenarse internamente las fechas como el nmero de segundos
transcurridos desde el 14 de octubre de 1582, la conversin de fechas a valores numricos puede
generar nmeros extremadamente grandes. Por ejemplo, la fecha 10/29/91 se convierte al valor
numrico 12.908.073.600.
Conversin de numrico a fecha u hora. Los valores numricos se convierten a fechas u horas si el
valor representa un nmero de segundos que puede producir una fecha u hora vlidos. Para las
fechas, los valores numricos menores que 86.400 se convierten al valor perdido del sistema.
Se inserta una fila nueva para el caso y todas las variables reciben el valor perdido del sistema.
95
Editor de datos
Se insertar una nueva variable con el valor perdido del sistema para todos los casos.
la columna de variables a la derecha del lugar donde desea colocar la variable, o en la Vista de
variables, arrastre la variable a la fila de variables debajo de donde desee colocarla.
96
Captulo 5
Casos
E Para los casos, elija en los mens:
Edicin
Ir a caso...
E Escriba un valor entero que represente el nmero de fila actual en la Vista de datos.
Nota: el nmero de fila actual de un determinado caso puede cambiar debido al orden o a otras
acciones.
Variables
E Para las variables, elija en los mens:
Edicin
Ir a la variable...
E Escriba el nombre de la variable o seleccione la variable en la lista desplegable.
Figura 5-11
Cuadro de dilogo Ir a
Imputaciones
E Elija en los mens:
Edicin
Ir a imputacin...
E Seleccione la imputacin (o datos originales) en la lista desplegable.
Figura 5-12
Cuadro de dilogo Ir a
97
Editor de datos
La posicin relativa de caso se mantiene al seleccionar imputaciones. Por ejemplo, si hay 1.000
casos en el conjunto de datos original, el caso 1.034, el 34 caso de la primera imputacin, aparece
en la parte superior de la cuadrcula. Si selecciona la imputacin 2 en la lista desplegable, el caso
2034, el 34 caso de la segunda imputacin, aparecer en la parte superior de la cuadrcula. Si
selecciona Datos originales en la lista desplegable, el caso 34 aparecer en la parte superior de la
cuadrcula. La posicin de columna tambin se mantiene al desplazarse entre imputaciones, de
modo que es fcil comparar valores entre imputaciones.
o
Edicin
Reemplazar
Vista de datos
Para fechas y horas, se buscan los valores con formato, es decir, tal como aparecen en la
Vista de datos. Por ejemplo, si se busca la fecha 10-28-2007 no se encontrar una fecha
que aparezca como 10/28/2007.
98
Captulo 5
Para las dems variables numricas, Contiene, Comienza por y Termina por buscan valores con
formato. Por ejemplo, con la opcin Comienza por, un valor de bsqueda de $123 para una
variable con formato dlar encontrar tanto 123,00 como 123,40 pero no 1.234 dlares. Con
la opcin Casilla entera, el valor de bsqueda puede tener formato o no (formato numrico
F simple), pero slo se buscarn valores numricos exactos (con la precisin mostrada en
el Editor de datos).
Vista de variables
La bsqueda slo est disponible para Nombre, Etiqueta, Valores, Perdidos y las columnas de
atributos de variable personalizados.
99
Editor de datos
Figura 5-14
Casos filtrados en el Editor de datos
En la Vista de datos, puede crear varias vistas (paneles) mediante los divisores situados debajo de
la barra de desplazamiento horizontal y a la derecha de la barra de desplazamiento vertical.
Tambin puede utilizar el men Ventana para insertar y eliminar divisores de paneles. Para
insertar divisores:
E En la Vista de datos, elija en los mens:
Ventana
Dividir
100
Captulo 5
Si se ha seleccionado la casilla superior izquierda, los divisores se insertan para dividir la vista
actual aproximadamente por la mitad horizontal y verticalmente.
Si se selecciona una casilla distinta de la primera casilla de fila superior, se inserta un divisor
de paneles verticales a la izquierda de la casilla seleccionada.
Utilice el men Ver en la ventana Editor de datos para mostrar u ocultar las lneas de cuadrcula y
para que se muestren o no los valores de los datos y las etiquetas de valor.
Captulo
A partir de SPSS 14.0, se pueden tener varios orgenes de datos abiertos al mismo tiempo,
lo que facilita:
Fundir varios orgenes de datos con diferentes formatos de datos (por ejemplo, hojas de
clculo, bases de datos, datos en texto) sin tener que guardar antes cada origen de datos.
101
102
Captulo 6
Por defecto, cada origen de datos que se abra aparecer en una nueva ventana del Editor de datos.
(ConsulteGeneral: Opciones para obtener informacin sobre cmo cambiar el comportamiento
por defecto para que slo muestre un conjunto de datos al mismo tiempo, en una sola ventana
Editor de datos.)
Todos los orgenes de datos que haya abierto anteriormente permanecern abiertos y estarn
disponibles para su uso.
Para cambiar el conjunto de datos activo basta con pulsar en cualquier parte de la ventana del
Editor de datos del origen de datos que desee utilizar o bien seleccionar la ventana del Editor
de datos correspondiente a dicho origen de datos en el men Ventana.
103
Trabajo con varios orgenes de datos
Slo ser posible analizar las variables del conjunto de datos activo.
Figura 6-2
Lista de variables con las variables del conjunto de datos activo
No se puede cambiar el conjunto de datos activo mientras est abierto cualquier cuadro de
dilogo que acceda a los datos (incluidos todos los cuadros de dilogo que muestran las
listas de variables).
Al menos una ventana del Editor de datos debe estar abierta durante una sesin. Al cerrar
la ltima ventana abierta del Editor de datos, SPSS Statistics se cierra automticamente,
preguntndole antes si desea guardar los cambios.
104
Captulo 6
Al trabajar con la sintaxis de comandos, aparece el nombre del conjunto de datos activo en la
barra de herramientas de la ventana de sintaxis. Todas las acciones siguientes pueden cambiar el
conjunto de datos activo:
Figura 6-3
Conjuntos de datos abiertos mostrados en la barra de herramientas de la ventana de sintaxis
Al copiar y pegar determinadas casillas de datos en la Vista de datos se pegan nicamente los
valores de los datos, sin los atributos de definicin de variables.
Si se copia y pega una variable entera en la Vista de datos seleccionando el nombre de dicha
variable que aparece en la parte superior de la columna, se pegarn todos los datos y todos los
atributos de definicin de variables correspondientes a dicha variable.
Al copiar y pegar los atributos de definicin de variables o las variables enteras en la Vista de
variables, se pegarn los atributos seleccionados (o toda la definicin de la variable) pero no
se pegar ningn valor de los datos.
105
Trabajo con varios orgenes de datos
Captulo
Preparacin de datos
Cuando abra un archivo de datos o introduzca datos en el Editor de datos, podr empezar a crear
informes, grficos y anlisis sin ningn trabajo preliminar adicional. Sin embargo, hay algunas
funciones de preparacin adicional de los datos que pueden resultarle tiles, entre las que se
incluyen:
Asignar propiedades de las variables que describan los datos y determinen cmo se deben
tratar ciertos valores.
Identificar los casos que pueden contener informacin duplicada y excluir dichos casos de los
anlisis o eliminarlos del archivo de datos.
Crear nuevas variables con algunas categoras distintas que representen rangos de valores de
variables que tengan un mayor nmero de valores posibles.
Propiedades de variables
Los datos introducidos en la Vista de datos del Editor de datos o ledos desde un formato de
archivos externo (como una hoja de clculo de Excel o un archivo de datos de texto) carecen de
ciertas propiedades de variables que pueden resultar muy tiles, como:
Todas estas propiedades de variables (y otras) se pueden asignar en la Vista de variables del Editor
de datos. Tambin hay algunas utilidades que le pueden ofrecer asistencia en este proceso:
valores perdidos. Esto es especialmente til para datos categricos con cdigos numricos
utilizados para valores de categoras.
Copiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos con SPSS
Statistics como plantilla para definir las propiedades de variables y archivos en el archivo
de datos actual. Esto es particularmente til si utiliza frecuentemente archivos de datos con
un formato externo que tenga un contenido similar, como puedan ser informes mensuales en
formato Excel.
106
107
Preparacin de datos
Explora los datos reales y enumera todos valores de datos nicos para cada variable
seleccionada.
Nota: Para utilizar Definir propiedades de variables sin explorar primero los casos, introduzca 0
para el nmero de casos que se van a explorar.
E Seleccione las variables numricas o de cadena para las que desea crear etiquetas de valor o
definir o cambiar otras propiedades de las variables, como los valores perdidos o las etiquetas de
variable descriptivas.
108
Captulo 7
E Especificar el nmero de casos que se van a explorar para generar la lista de valores nicos.
Resulta especialmente til para los archivos de datos con mayor nmero de casos, para el cual una
exploracin del archivo de datos completo podra tardar una gran cantidad de tiempo.
E Especifique un lmite superior para el nmero de valores nicos que se va a visualizar. Esto es
especialmente til para evitar que se generen listas de cientos, miles o incluso millones de valores
para las variables de escala (intervalo continuo, razn).
E Pulse en Continuar para abrir el cuadro de dilogo Definir propiedades de variables principal.
E Seleccione una variable para la que desee crear etiquetas de valor o definir o cambiar otras
valores.
E Si hay valores para los que desea crear etiquetas de valor, pero no se visualizan dichos valores,
puede introducirlos en la columna Valores por debajo del ltimo valor explorado.
E Repita este proceso para cada variable de la lista para la que desee crear etiquetas de valor.
E Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las variables.
109
Preparacin de datos
Para ordenar la lista de variables para que aparezcan todas las variables con valores sin etiquetas
en la parte superior de la lista:
E Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables exploradas.
Tambin puede ordenarla por nombre de variable o nivel de medida pulsando en el encabezado de
columna correspondiente debajo de la Lista de variables exploradas.
Rejilla etiqueta valores
Etiqueta. Muestra las etiquetas de valor que ya se han definido. Puede aadir o cambiar las
Valor. Valores nicos para cada variable seleccionada. Esta lista de valores nicos se basa en
el nmero de casos explorados. Por ejemplo, si slo ha explorado los primeros 100 casos del
archivo de datos, la lista reflejar slo los valores nicos presentes en esos casos. Si el archivo
de datos ya se ha ordenado por la variable para la que desea asignar etiquetas de valor, la lista
puede mostrar muchos menos valores nicos de los que hay realmente presentes en los datos.
Recuento. Nmero de veces que aparece cada valor en los casos explorados.
Perdidos. Valores definidos para representar valores perdidos. Puede cambiar la designacin
de la categora de los valores perdidos pulsando en la casilla de verificacin. Una marca indica
que la categora se ha definido como categora perdida por el usuario. Si una variable ya tiene
un rango de valores definidos como perdidos por el usuario (por ejemplo 90 - 99), no podr
aadir ni eliminar categoras de valores perdidos para esa variable con Definir propiedades de
variables. Puede utilizar la Vista de variables del Editor de datos para modificar las categoras
de valores perdidos para la variable con rangos de valores perdidos. Si desea obtener ms
informacin, consulte Valores perdidos en Captulo 5 el p. 84.
Nota: Si ha especificado 0 para el nmero de casos que se van a explorar en el cuadro de dilogo
inicial, la rejilla etiqueta valores estar en blanco al principio, a excepcin de algunas etiquetas
de valor ya existentes y/o categoras de valores perdidos definidas para la variable seleccionada.
Adems, se desactivar el botn Sugerir para el nivel de medida.
Nivel de medida. Las etiquetas de valor son especialmente tiles para las variables categricas
110
Captulo 7
Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables de
Para las variables de cadena, slo puede cambiar la etiqueta de variable, no el formato
de presentacin.
Para las variables numricas, puede cambiar el tipo numrico (como numrico, fecha, dlar
o moneda personalizada), el ancho (nmero mximo de dgitos, incluyendo los indicadores
decimales y/o de agrupacin) y el nmero de posiciones decimales.
Para el formato de fecha numrica, puede seleccionar un formato de fecha especfico (como
dd-mm-aaaa, mm/dd/aa, aaaaddd).
Para formato numrico personalizado, puede seleccionar uno de los cinco formatos de moneda
personalizados (de CCA a CCE). Si desea obtener ms informacin, consulte Moneda:
Opciones en Captulo 48 el p. 532.
Aparece un perodo (.) si los valores explorados o los valores mostrados para etiquetas de
valor definidas ya existentes o categoras de valores perdidos no son vlidos para el tipo de
formato de presentacin seleccionado. Por ejemplo, un valor numrico interno inferior a
86.400 no es vlido para una variable de formato de fecha.
111
Preparacin de datos
Figura 7-3
Cuadro de dilogo Sugerir nivel de medida
Nota: Los valores definidos para representar valores perdidos no se incluyen en la evaluacin
para el nivel de medida. Por ejemplo, la explicacin del nivel de medida sugerido puede indicar
que la sugerencia se basa, en parte, en el hecho de que la variable no contiene valores negativos,
mientras que, de hecho, puede contener valores negativos, pero dichos valores ya se han definido
como valores perdidos.
E Pulse en Continuar para aceptar el nivel de medida sugerido o en Cancelar para mantener el mismo.
112
Captulo 7
Figura 7-4
Atributos de variable personalizados
Nombre. Los nombres de atributo deben cumplir las mismas reglas que los nombres de variable.
Si desea obtener ms informacin, consulte Nombres de variable en Captulo 5 el p. 79.
Valor. Valor asignado al atributo de la variable seleccionada.
Los nombres de atributo que comienzan con un signo de dlar son reservados y no se pueden
modificar. Puede ver el contenido de un atributo reservado pulsando el botn de la casilla
que desee.
Si aparece el texto Matriz..., en una casilla de valor, indica que se trata de una matriz de
atributos, un atributo que contiene varios valores. Pulse en el botn de la casilla para
mostrar la lista de valores.
113
Preparacin de datos
Figura 7-5
Cuadro de dilogo Aplicar etiquetas y medida a
E Seleccione una nica variable desde la que va a copiar las etiquetas de valor y otras propiedades
de las variables.
E Pulse en Copiar para copiar las etiquetas de valor y el nivel de medida.
Las etiquetas de valor existentes y categoras de valores perdidos para las variables de destino
no se sustituyen.
Las etiquetas de valor y las categoras de valores perdidos para los valores que no se han
definido an para las variables de destino se aaden al conjunto de etiquetas de valor y
categoras de valores perdidos para las variables de destino.
114
Captulo 7
Los conjuntos de respuestas mltiples se crean a partir de mltiples variables del archivo de
datos. Un conjunto de respuestas mltiples es un constructo especial perteneciente a un archivo de
datos. Se pueden definir y guardar varios conjuntos en un archivo de datos SPSS Statistics, pero
no se pueden importar o exportar conjuntos de respuestas mltiples desde o a otros formatos de
archivo. (Se pueden copiar conjuntos de respuestas mltiples de otros archivos de datos SPSS
Statistics mediante Copiar propiedades de datos en el men Datos en la ventana Editor de datos.
Si desea obtener ms informacin, consulte Copia de propiedades de datos el p. 116.
E Seleccione dos o ms variables. Si las variables estn codificadas como dicotomas, indique
hasta 63 bytes. De forma automtica, se aade un signo dlar al comienzo del nombre del conjunto.
E Escriba una etiqueta descriptiva para el conjunto. (Esto es opcional.)
E Pulse Aadir para aadir el conjunto de respuestas mltiples a la lista de conjuntos definidos.
115
Preparacin de datos
Dicotomas
Con ello se muestran las variables y las opciones utilizadas para definir este conjunto de respuestas
mltiples.
La lista Variables del conjunto, muestra las cinco variables utilizadas para construir el
conjunto de respuestas mltiples.
El valor contado es 1.
E Seleccione (pulse en) una de las variables de la lista Variables del conjunto.
E Pulse con el botn derecho del ratn en la variable y seleccione Informacin sobre la variable
Las etiquetas de valor indican que la variable es una dicotoma con valores de 0 y 1, que
representan No y S, respectivamente. Las cinco variables de la lista estn codificadas de la misma
manera y el valor de 1 (el cdigo para S) es el valor contado para el conjunto de dicotomas
mltiples.
116
Captulo 7
Categoras
Etiquetas de variable. Utiliza las etiquetas de variable definidas (o los nombres de variable para
las variables que no tienen etiquetas de variable definidas) como las etiquetas de categora de
conjunto. Por ejemplo, si todas las variables del conjunto tienen la misma etiqueta de valor (o
no tienen etiquetas de valor definidas) para el valor contado (por ejemplo, S), debe utilizar las
etiquetas de variable como las etiquetas de categora de conjunto.
Etiquetas de valores contados. Utiliza las etiquetas de valor definidas de los valores contados
como etiquetas de categora de conjunto. Seleccione esta opcin slo si todas las variables
tienen una etiqueta de valor definida para el valor contado y la etiqueta de valor para el
valor contado es distinta para cada variable.
117
Preparacin de datos
Copiar las propiedades de variable seleccionadas de una variable, ya sea del archivo de datos
externo, de un conjunto de datos abierto o del conjunto de datos activo, en diversas variables
del conjunto de datos activo.
Crear nuevas variables en el conjunto de datos activo basndose en las variables seleccionadas
del archivo de datos externo o un conjunto de datos abierto.
Para copiar un archivo de datos externo como archivo de datos de origen, deber tratarse de un
archivo de datos con formato SPSS Statistics.
Para utilizar el conjunto de datos activo como archivo de datos de origen, deber contener al
menos una variable. No podr utilizar un conjunto de datos activo que est completamente
en blanco como archivo de datos de origen.
Las propiedades no definidas (vacas) del conjunto de datos de origen no sobrescriben las
propiedades definidas en el conjunto de datos activo.
Las propiedades de variable se copian desde la variable de origen nicamente a las variables
de destino de un tipo coincidente: de cadena (alfanumricas) o numrico (incluidas numricas,
fecha y moneda).
Nota: En el men Archivo, Copiar propiedades de datos sustituir a Aplicar diccionario de datos,
disponible anteriormente.
118
Captulo 7
Figura 7-8
Asistente para la copia de propiedades de datos: Paso 1
E Seleccione el archivo de datos que contenga las propiedades de archivo y/o variable que desee
copiar. Puede ser un conjunto de datos abierto actualmente, un archivo de datos con formato SPSS
Statistics externo o el conjunto de datos activo.
E Siga las instrucciones detalladas del Asistente para la copia de propiedades de datos.
119
Preparacin de datos
Figura 7-9
Asistente para la copia de propiedades de datos: Paso 2
variables de origen seleccionadas en las variables coincidentes del conjunto de datos activo. Las
variables coinciden si el nombre y el tipo de variable (de cadena o numrico) son los mismos.
En el caso de las variables de cadena, la longitud tambin debe ser la misma. Por defecto, slo se
muestran en las dos listas de variables las variables coincidentes.
lista de origen para que muestre todas las variables del archivo de datos de origen. Si se
seleccionan variables de origen que no existen en el conjunto de datos activo (basndose en
el nombre de variable), se crearn nuevas variables en el conjunto de datos activo con los
nombres y las propiedades de variable del archivo de datos de origen.
Si el conjunto de datos activo no contiene variables (un nuevo conjunto de datos en blanco), se
mostrarn todas las variables del archivo de datos de origen y se crearn automticamente en el
conjunto de datos activo nuevas variables basadas en las variables de origen seleccionadas.
Aplicar propiedades de una nica variable de origen a variables seleccionadas del mismo tipo del
conjunto de datos activo. Las propiedades de variable de una nica variable seleccionada en la
lista de origen se pueden aplicar a una o ms variables seleccionadas de la lista del conjunto de
120
Captulo 7
datos activo. En esta lista slo se mostrarn las variables que sean del mismo tipo (numrico o de
cadena) que la variable seleccionada en la lista de origen. Si se trata de variables de cadena, slo
se mostrarn las cadenas con la misma longitud definida que la variable de origen. Esta opcin no
est disponible si el conjunto de datos activo no contiene variables.
Nota: No se pueden crear nuevas variables en el conjunto de datos activo con esta opcin.
Aplicar slo propiedades de conjunto de datos (sin seleccin de variables). Slo se pueden aplicar
al conjunto de datos activo las propiedades de archivo (por ejemplo, documentos, etiquetas
de archivo, grosor). No se podr aplicar ninguna propiedad de variable. Esta opcin no est
disponible si el conjunto de datos activo es tambin el archivo de datos de origen.
121
Preparacin de datos
Etiquetas de valor. Las etiquetas de valor son etiquetas descriptivas asociadas a valores de datos.
Se suelen utilizar cuando se seleccionan valores de datos numricos para representar categoras
no numricas (por ejemplo, cdigos 1 y 2 para Hombre y Mujer). Puede reemplazar o fundir las
etiquetas de valor en las variables de destino.
Reemplazar elimina todas las etiquetas de valor definidas para la variable de destino y las
Fundir funde las etiquetas de valor definidas en la variable de origen con cualquier etiqueta de
valor definida existente en la variable de destino. Si existe una etiqueta de valor definida con
el mismo valor tanto en la variable de origen como en la de destino, la etiqueta de valor de la
variable de destino permanecer inalterada.
Atributos personalizados. Atributos de variable personalizados definidos por el usuario. Si desea
Reemplazar elimina todos los atributos personalizados para la variable de destino y los
Fundir funde los atributos definidos de la variable de origen con cualquier atributo definido
perdidos (por ejemplo, 98 para No se conoce y 99 para No procede). Por lo general, estos valores
tienen tambin etiquetas de valor definidas que describen el significado de cdigos de valores
perdidos. Todos los valores perdidos existentes definidos para la variable de destino se eliminarn
y se reemplazarn por los valores perdidos de la variable de origen.
Etiqueta de variable. Las etiquetas de variable descriptivas pueden contener espacios y caracteres
reservados que no se permiten en los nombres de las variables. Si desea utilizar esta opcin
para copiar propiedades de variable desde una variable de origen en varias variables de destino,
reflexione antes de hacerlo.
Nivel de medida. El nivel de medida puede ser nominal, ordinal o de escala. En los procedimientos
que diferencian entre los distintos niveles de medida, tanto el nivel nominal como el ordinal
se consideran categricos.
Formatos. Controla el tipo numrico (como numrico, fecha o moneda), el ancho (nmero total
de caracteres que se muestran, incluidos los caracteres iniciales y finales y el indicador decimal)
y el nmero de decimales que se van a mostrar para las variables numricas. Esta opcin no se
tendr en cuenta para las variables de cadena.
Alineacin. Afecta nicamente a la alineacin (izquierda, derecha, central) del Editor de datos
de la Vista de datos.
Ancho de columna del Editor de datos. Afecta nicamente al ancho de columna de la Vista de
122
Captulo 7
Figura 7-11
Asistente para la copia de propiedades de datos: Paso 4
Conjuntos resp. mltiples. Aplica definiciones del conjunto de respuestas mltiples del archivo de
Se ignorarn los conjuntos de respuestas mltiples del archivo de datos de origen que
contengan variables no existentes en el conjunto de datos activo, a menos que se creen estas
variables basndose en las especificaciones del paso 2 (Seleccin de las variables de origen y
de destino) del Asistente para la copia de propiedades de datos.
Reemplazar elimina todos los conjuntos de respuestas mltiples del conjunto de datos activo y
Fundir aade los conjuntos de respuestas mltiples del archivo de datos de origen a la coleccin
de este tipo de conjuntos incluida en el conjunto de datos activo. En caso de que exista un
conjunto con el mismo nombre en ambos archivos, el conjunto existente del conjunto de
datos activo permanecer inalterado.
Conjuntos de variables. Los conjuntos de variables se utilizan para controlar la lista de variables
que se muestra en los cuadros de dilogo. Para definir conjuntos de variables, seleccione Definir
conjuntos en el men Utilidades.
Se ignorarn los conjuntos del archivo de datos de origen que contengan variables no
existentes en el conjunto de datos activo, a menos que se creen estas variables basndose
en las especificaciones del paso 2 (Seleccin de las variables de origen y de destino) del
Asistente para la copia de propiedades de datos.
123
Preparacin de datos
Reemplazar elimina todos los conjuntos de variables existentes en el conjunto de datos activo
Fundir aade los conjuntos de variables del archivo de datos de origen a la coleccin de este
tipo de conjuntos incluida en el conjunto de datos activo. En caso de que exista un conjunto
con el mismo nombre en ambos archivos, el conjunto existente del conjunto de datos activo
permanecer inalterado.
Documentos. Notas aadidas al archivo de datos a travs del comando DOCUMENT.
Reemplazar elimina todos los documentos existentes en el conjunto de datos activo y los
Fundir combina los documentos incluidos en los conjuntos de datos de origen y de trabajo.
Los documentos exclusivos del archivo de origen que no existan en el conjunto de datos
activo se aadirn al conjunto de datos activo. A continuacin, todos los documentos se
ordenarn por fecha.
Atributos personalizados. Atributos del archivo de datos personalizados, creados normalmente por
el comando DATAFILE ATTRIBUTE en la sintaxis de comandos.
Reemplazar elimina todos los atributos del archivo de datos personalizados existentes en el
conjunto de datos activo y los reemplaza por los incluidos en el archivo de datos de origen.
Fundir combina los del archivo de datos de los conjuntos de datos de origen y activo. Los
nombres de atributos exclusivos del archivo de origen que no existan en el conjunto de datos
activo se aadirn al conjunto de datos activo. En caso de que exista un atributo con el mismo
nombre en ambos archivos de datos, el atributo con nombre existente en el conjunto de datos
activo permanecer inalterado.
Especificacin de ponderacin. Pondera los casos por la variable de ponderacin actual del archivo
de datos de origen, siempre que exista una variable coincidente en el conjunto de datos activo.
Sobrescribe cualquier ponderacin activada actualmente en el conjunto de datos activo.
Etiqueta de archivo. Etiqueta descriptiva que se aplica a un archivo de datos mediante el comando
FILE LABEL.
124
Captulo 7
Resultados
Figura 7-12
Asistente para la copia de propiedades de datos: Paso 5
El ltimo paso del Asistente para la copia de propiedades de datos proporciona informacin sobre
el nmero de variables para las que se van a copiar las propiedades de variable del archivo de
datos de origen, el nmero de nuevas variables que se van a crear y el nmero de propiedades (de
archivo) de conjunto de datos que se van a copiar.
Tambin puede pegar la sintaxis de comandos generada en una ventana de sintaxis y guardarla
para su posterior uso.
Errores en la entrada de datos si por accidente se introduce el mismo caso ms de una vez.
Casos mltiples que comparten un valor de identificador primario comn pero tienen valores
diferentes de un identificador secundario, como los miembros de una familia que viven en
el mismo domicilio.
Casos mltiples que representan el mismo caso pero con valores diferentes para variables que
no sean las que identifican el caso, como en el caso de varias compras realizadas por la misma
persona o empresa de diferentes productos o en diferentes momentos.
La identificacin de los casos duplicados le permite definir prcticamente como quiera lo que
se considera duplicado y le proporciona cierto control sobre la determinacin automtica de
los casos primarios frente a los duplicados.
125
Preparacin de datos
Si lo desea, puede:
E Seleccionar una o varias variables para ordenar los casos dentro de los bloques definidos por las
variables seleccionadas de casos coincidentes. El orden definido por estas variables determina el
primer y el ltimo caso de cada bloque. En caso contrario, se utilizar el orden del archivo
original.
E Filtrar automticamente los casos duplicados de manera que no se incluyan en los informes, los
Definir casos coincidentes por. Los casos se consideran duplicados si sus valores coinciden para
todas las variables seleccionadas. Si desea identificar nicamente aquellos casos que coincidan
al 100% en todos los aspectos, seleccione todas las variables.
126
Captulo 7
Ordenar dentro de los bloques coincidentes por. Los casos se ordenan automticamente por las
variables que definen los casos coincidentes. Puede seleccionar otras variables de ordenacin que
determinarn el orden secuencial de los casos en cada bloque de coincidencia.
Si selecciona ms de una variable de ordenacin, los casos se ordenarn por cada variable
dentro de las categoras de la variable anterior de la lista. Por ejemplo, si selecciona fecha
como la primera variable de ordenacin y cantidad como la segunda, los casos se ordenarn
por cantidad dentro de cada fecha.
Utilice los botones de flecha hacia arriba y hacia abajo que hay a la derecha de la lista para
cambiar el orden de las variables.
Variable indicador de casos primarios. Crea una variable con un valor de 1 para todos los casos
nicos y para el caso identificado como caso primario en cada bloque de casos coincidentes y
un valor de 0 para los duplicados no primarios de cada bloque.
El caso primario puede ser el primer o el ltimo caso de cada bloque de coincidencia,
segn determine el orden del bloque de coincidencia. Si no especifica ninguna variable de
ordenacin, el orden del archivo original determina el orden de los casos dentro de cada
bloque.
Puede utilizar la variable indicador como una variable de filtro para excluir los duplicados que
no sean primarios de los informes y los anlisis sin eliminar dichos casos del archivo de datos.
Recuento secuencial de casos coincidentes en cada bloque. Crea una variable con un valor
que todos los bloques de casos coincidentes estn en la parte superior del archivo de datos,
facilitando la inspeccin visual de los casos coincidentes en el Editor de datos.
Mostrar tabla de frecuencias de las variables creadas. Las tablas de frecuencias contienen los
recuentos de cada valor de las variables creadas. Por ejemplo, para la variable de indicador de
caso primario, la tabla mostrara tanto el nmero de casos con un valor de 0 en esa variable, que
indica el nmero de duplicados, como el nmero de casos con un valor de 1 para esa variable, que
indica el nmero de casos nicos y primarios.
Valores perdidos. En el caso de variables numricas, los valores perdidos del sistema se tratan
como cualquier otro valor: los casos que tengan el valor perdido del sistema para una variable de
identificacin se tratarn como si tuviesen valores coincidentes para dicha variable. En el caso de
variables de cadena, los casos que no tengan ningn valor para una variable de identificacin se
tratarn como si tuviesen valores coincidentes para dicha variable.
127
Preparacin de datos
Agrupacin visual
La agrupacin visual est concebida para ayudarle en el proceso de creacin de nuevas variables
basadas en la agrupacin de los valores contiguos de las variables existentes para dar lugar a un
nmero limitado de categoras diferentes. Puede utilizar la agrupacin visual para:
Crear variables categricas a partir de variables de escala continuas. Por ejemplo, puede
utilizar una variable de escala con los ingresos para crear una variable categrica nueva que
contenga intervalos de ingresos.
Como alternativa, puede limitar la cantidad de casos que se van a explorar. Con los archivos de
datos que contengan un elevado nmero de casos, la limitacin del nmero de casos que se va a
explorar puede ahorrar tiempo, pero debe evitarse este procedimiento en lo posible, ya que afectar
a la distribucin de los valores que se utilizarn en los clculos posteriores en la agrupacin visual.
Nota: Las variables de cadena y las variables numricas nominales no se muestran en la lista de
variables origen. La agrupacin visual requiere que las variables sean numricas, medidas bien a
nivel ordinal o de escala, puesto que supone que los valores de los datos representan algn tipo de
orden lgico que se puede utilizar para agrupar los valores con sentido. Puede cambiar el nivel
de medida de una variable en la Vista de variables del Editor de datos. Si desea obtener ms
informacin, consulte Nivel de medida de variable en Captulo 5 el p. 80.
128
Captulo 7
Agrupacin de variables
Figura 7-15
Agrupacin visual, cuadro de dilogo principal
129
Preparacin de datos
usuario y perdidos del sistema. Los valores perdidos no se incluyen en ninguno de las categoras
agrupadas. Si desea obtener ms informacin, consulte Valores perdidos definidos por el usuario
en la agrupacin visual el p. 135.
Variable actual. El nombre y etiqueta de variable (si existe) de la variable actualmente seleccionada
y que se usar como base para la nueva variable agrupada.
Variable agrupada. Nombre y etiqueta de variable alternativa para la nueva variable agrupada.
Nombre. Debe introducir un nombre para la nueva variable. Los nombres de variable no
pueden repetirse, y deben seguir las normas de denominacin de variables. Si desea obtener
ms informacin, consulte Nombres de variable en Captulo 5 el p. 79.
Etiqueta. Puede introducir una etiqueta de variable descriptiva con una longitud de hasta 255
caracteres. La etiqueta de variable por defecto ser la etiqueta de variable (si existe) o el
nombre de variable de la variable origen con el texto (Agrupada) aadido al final de la etiqueta.
Mnimo y Mximo. Valores mnimo y mximo para la variable seleccionada actualmente, basados
en los casos explorados y excluyendo los valores definidos como perdidos por el usuario.
Valores no perdidos. El histograma muestra la distribucin de valores no perdidos correspondiente
Despus de haber definido los intervalos para la nueva variable, se mostrarn lneas verticales
en el histograma para indicar los puntos de corte que definen los intervalos.
Puede pulsar y arrastrar las lneas de los puntos de corte a distintos puntos del histograma,
modificando as la amplitud de los intervalos.
Puede eliminar intervalos arrastrando las lneas de los puntos de corte fuera del histograma.
130
Captulo 7
Valor. Valores que definen los puntos de corte superiores en cada intervalo. Puede introducir
los valores o utilizar Crear puntos de corte para crear automticamente los intervalos
basndose en los criterios seleccionados. Por defecto, se incluye automticamente un punto
de corte con el valor SUPERIOR. Este intervalo contendr cualesquiera valores no perdidos
por encima de los restantes puntos de corte. El intervalo definido por el punto de corte
inferior incluir todos los valores no perdidos que sean menores o iguales que dicho valor
(o, sencillamente, inferiores a ese valor, dependiendo de la forma en que haya definido los
puntos de corte superiores).
Puesto que los valores de la nueva variable slo sern nmeros enteros en secuencia, del 1 a
n, las etiquetas que describan lo que representan los valores pueden resultar muy tiles.
Puede introducir las etiquetas o usar Crear etiquetas para crear las etiquetas de valor de forma
automtica.
Para eliminar un intervalo de la rejilla
E Pulse con el botn derecho en las casillas Valor o Etiqueta del intervalo.
E En el men contextual emergente, seleccione Eliminar fila.
Nota: Si elimina el intervalo SUPERIOR, los casos con valores superiores al valor del ltimo
punto de corte especificado recibirn el valor perdido del sistema en la nueva variable.
Para eliminar todas las etiquetas o todos los intervalos definidos
E Pulse en cualquier parte de la rejilla con el botn derecho del ratn.
E En el men contextual emergente, seleccione Eliminar todas las etiquetas o Eliminar todos los
puntos de corte.
Lmites superiores. Controla el tratamiento de los valores de los lmites superiores introducidos en
la columna Valor de la rejilla.
Incluidos (<=). Los casos con el valor especificado en la casilla Valor se incluyen en la
categora agrupada. Por ejemplo, si especifica los valores 25, 50 y 75, los casos con el valor
exacto 25 se incluirn en el primer intervalo, ya que se incluirn todos los casos con valor
menor o igual que 25.
Excluido (<). Los casos con el valor especificado en la casilla Valor no se incluyen en la
igual amplitud, intervalos con el mismo nmero de casos o intervalos basados en un nmero de
desviaciones tpicas. Esta posibilidad no est disponible si no se ha explorado ningn caso. Si
desea obtener ms informacin, consulte Generacin automtica de categoras agrupadas el p. 131.
131
Preparacin de datos
Crear etiquetas. Genera etiquetas descriptivas para los valores enteros consecutivos contenidos en
la nueva variable agrupada, en funcin de los valores de la rejilla y el tratamiento especificado
para los lmites superiores (incluidos o excluidos).
Invertir la escala. Por defecto, los valores de la nueva variable agrupada sern nmeros enteros
seleccionada en ese momento, o desde la variable seleccionada en ese momento a otras varias
variables. Si desea obtener ms informacin, consulte Copia de categoras agrupadas el p. 133.
132
Captulo 7
Figura 7-16
Cuadro de dilogo Crear puntos de corte
Nota: El cuadro de dilogo Crear puntos de corte no est disponible si no se ha explorado ningn
caso.
Intervalos de igual amplitud. Genera categoras agrupadas de igual amplitud (por ejemplo, 110,
Posicin del primer punto de corte. Valor que define el lmite superior de la categora agrupada
inferior (por ejemplo, el valor 10 indica un intervalo que incluya todos los valores hasta 10).
Amplitud. La amplitud de cada intervalo. Por ejemplo, el valor 10 agrupar la variable Edad
ms uno. Por ejemplo, tres puntos de corte generan cuatro intervalos percentiles (cuartiles),
conteniendo cada uno el 25% de los casos.
total de casos. Por ejemplo, el valor 33,3 generara tres categoras agrupadas (dos puntos de
corte), conteniendo cada una el 33,3% de los casos.
133
Preparacin de datos
En una distribucin normal, el 68% de los casos se encuentra dentro de una distancia de una
desviacin tpica respecto a la media, el 95% entre dos desviaciones tpicas y el 99% dentro de tres
desviaciones tpicas. La creacin de categoras agrupadas basadas en desviaciones tpicas puede
ocasionar que algunos intervalos queden definidos fuera del rango real de los datos, e incluso fuera
del rango de valores posibles de los datos (por ejemplo, un rango de salarios negativos).
Nota: Los clculos de los percentiles y las desviaciones tpicas se basan en los casos explorados.
Si limita el nmero de casos explorados, puede que los intervalos resultantes no incluyan la
proporcin de casos deseada en dichos intervalos, sobre todo si el archivo de datos se orden
segn la variable origen. Por ejemplo, si limita la exploracin a los primeros 100 casos de un
archivo de datos con 1000 casos y el archivo de datos est ordenado en orden descendente por
edad del encuestado, en lugar de cuatro intervalos percentiles de la edad, cada uno con el 25% de
los casos, podra encontrarse con que los tres primeros intervalos contuvieran cada una slo en
torno al 3,3% de los casos, mientras que el ltimo intervalo albergara el 90% de los casos.
134
Captulo 7
Figura 7-17
Copia de intervalos en la variable actual o desde ella
categoras agrupadas.
E Pulse A otras variables.
E Seleccione las variables para las que desea crear nuevas variables con las mismas categoras
agrupadas.
E Pulse Copiar.
o
E Seleccione (pulse) una variable de la Lista de variables exploradas sobre la cual desea copiar
135
Preparacin de datos
Captulo
En una situacin ideal, los datos brutos son perfectamente apropiados para el tipo de anlisis que
se desea realizar y cualquier relacin existente entre las variables o es adecuadamente lineal o es
claramente ortogonal. Desafortunadamente, esto ocurre pocas veces. El anlisis preliminar puede
revelar esquemas de codificacin poco prcticos o errores de codificacin, o bien pueden requerirse
transformaciones de los datos para exponer la verdadera relacin existente entre las variables.
Puede realizar transformaciones de los datos de todo tipo, desde tareas sencillas, como la
agrupacin de categoras para su anlisis posterior, hasta otras ms avanzadas, como la creacin
de nuevas variables basadas en ecuaciones complejas e instrucciones condicionales.
Clculo de variables
Utilice el cuadro de dilogo Calcular para calcular los valores de una variable basndose en
transformaciones numricas de otras variables.
Puede crear nuevas variables o bien reemplazar los valores de las variables existentes. Para las
nuevas variables, tambin se puede especificar el tipo y la etiqueta de variable.
136
137
Transformaciones de los datos
Figura 8-1
Cuadro de dilogo Calcular variable
Puede pegar las funciones o las variables de sistema utilizadas habitualmente seleccionando
un grupo de la lista Grupo de funciones y pulsando dos veces en la funcin o variable de las
listas de funciones y variables especiales (o seleccione la funcin o variable y pulse en la
flecha que se encuentra sobre la lista Grupo de funciones). Rellene los parmetros indicados
mediante interrogaciones (aplicable slo a las funciones). El grupo de funciones con la
etiqueta Todo contiene una lista de todas las funciones y variables de sistema disponibles. En
un rea reservada del cuadro de dilogo se muestra una breve descripcin de la funcin o
variable actualmente seleccionada.
Si los valores contienen decimales, debe utilizarse una coma (,) como indicador decimal.
Para las nuevas variables de cadena, tambin debern seleccionar Tipo y etiqueta para
especificar el tipo de datos.
138
Captulo 8
La mayora de las expresiones condicionales utilizan al menos uno de los seis operadores de
relacin (<, >, <=, >=, =, y ~=) de la calculadora.
una etiqueta o bien utilizar los primeros 110 caracteres de la expresin de clculo.
Tipo. Las variables calculadas pueden ser numricas o de cadena (alfanumricas). Las variables de
139
Transformaciones de los datos
Figura 8-3
Cuadro de dilogo Tipo y etiqueta
Funciones
Se dispone de muchos tipos de funciones, entre ellos:
Funciones aritmticas
Funciones estadsticas
Funciones de cadena
Funciones de distribucin
Si desea obtener ms informacin y una descripcin detallada de cada funcin, escriba funciones
en la pestaa ndice del sistema de ayuda.
El resultado es el valor perdido si un caso tiene un valor perdido para cualquiera de las tres
variables.
En la expresin:
MEAN(var1, var2, var3)
El resultado es el valor perdido slo si el caso tiene valores perdidos para las tres variables.
140
Captulo 8
En las funciones estadsticas se puede especificar el nmero mnimo de argumentos que deben
tener valores no perdidos. Para ello, escriba un punto y el nmero mnimo de argumentos despus
del nombre de la funcin, como en:
MEAN.2(var1, var2, var3)
un nmero aleatorio para utilizarlo en las transformaciones (como las funciones de distribucin
aleatorias), el muestreo aleatorio o la ponderacin de los casos. Para replicar una secuencia de
nmeros aleatorios, establezca el valor de inicializacin del punto de inicio antes de cada anlisis
que utilice los nmeros aleatorios. El valor debe ser un entero positivo.
Figura 8-4
Cuadro de dilogo Generadores de nmeros aleatorios
141
Transformaciones de los datos
Si lo desea, puede definir un subconjunto de casos en los que contar las apariciones de valores.
142
Captulo 8
143
Transformaciones de los datos
Figura 8-7
Cuadro de dilogo Contar apariciones: Si los casos
Si desea conocer las consideraciones generales sobre el uso del cuadro de dilogo Si los casos,
consulte Calcular variable: Si los casos el p. 138.
Cambiar valores
Cambiar valores crea nuevas variables que contienen los valores de variables existentes de casos
anteriores o posteriores.
Nombre. Nombre de la nueva variable. Debe ser un nombre que ya no existe en el conjunto
de datos activo.
Obtener el valor de un caso anterior (retardo). Obtener el valor de un caso anterior en el conjunto de
datos activo. Por ejemplo, con el nmero predeterminado del valor de casos 1, cada caso de la
nueva variable tiene el valor de la variable original del caso que la precede.
Obtener el valor del caso posterior (adelanto). Obtener el valor de un caso posterior en el conjunto
de datos activo. Por ejemplo, con el nmero predeterminado del valor de casos 1, cada caso de la
nueva variable tiene el valor de la variable original del caso siguiente.
Nmero de casos que se cambiarn. Obtener el valor del caso nanterior o siguiente, donde n es
144
Captulo 8
El valor de la variable de resultado est definido como valores perdidos del sistema para el
primer o ltimo caso n del conjunto de datos o grupo de segmentacin, donde n es el valor
especificado para Nmero de casos que se cambiarn. Por ejemplo, si utiliza el mtodo de
retardo con un valor de 1, definir la variable de resultados como valor perdidos del sistema
para el primer caso del conjunto de datos (o el primer caso en cada grupo de segmentacin).
Recodificacin de valores
Los valores de datos se pueden modificar mediante la recodificacin. Esto es particularmente til
para agrupar o combinar categoras. Puede recodificar los valores dentro de las variables existentes
o crear variables nuevas que se basen en los valores recodificados de las variables existentes.
145
Transformaciones de los datos
Figura 8-8
Cuadro de dilogo Recodif. en mismas var.
Si lo desea, puede definir un subconjunto de los casos para su recodificacin. El cuadro de dilogo
Si los casos para esto es igual al que se describe para Contar apariciones.
Valor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser el
mismo tipo de datos (numrico o de cadena) que el de las variables que se van recodificar.
Perdido por el sistema. Valores asignados por el programa cuando los valores de sus datos
no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un campo
numrico est vaco, o cuando no est definido un valor como resultado de un comando de
transformacin. Los valores numricos perdidos del sistema se muestran como puntos. Las
variables de cadena no pueden tener valores perdidos del sistema, ya que es lcito cualquier
carcter en las variables de cadena.
146
Captulo 8
Perdido por el sistema o por el usuario. Observaciones que tienen valores que el usuario ha
declarado perdidos o que son desconocidos y se les ha asignado el valor perdido del sistema,
lo que se indica mediante un punto (.).
Todos los dems valores. Cualquier valor no incluido en una de las especificaciones de la lista
Valor. Valor en el que se va a recodificar uno o ms valores antiguos. El tipo de datos (numrico
o de cadena) del valor introducido debe coincidir con el tipo de datos del valor antiguo.
Perdido por el sistema. Recodifica el valor antiguo especificado como valor perdido por el
sistema. El valor perdido por el sistema no se utiliza en los clculos. Adems, los casos
con valor perdido por el sistema se excluyen de muchos procedimientos. No disponible
para variables de cadena.
Antiguo>Nuevo. Contiene la lista de especificaciones que se va a utilizar para recodificar la
variable o las variables. Puede aadir, cambiar y borrar las especificaciones que desee. La lista se
ordena automticamente basndose en la especificacin del valor antiguo y siguiendo este orden:
valores nicos, valores perdidos, rangos y todos los dems valores. Si cambia una especificacin
de recodificacin en la lista, el procedimiento volver a ordenar la lista automticamente, si fuera
necesario, para mantener este orden.
Figura 8-9
Cuadro de dilogo Valores antiguos y nuevos
147
Transformaciones de los datos
Si selecciona mltiples variables, todas deben ser del mismo tipo. No se pueden recodificar
juntas las variables numricas y de cadena.
Figura 8-10
Cuadro de dilogo Recodif. en distintas var. (Recodificar en distintas variables)
Si lo desea, puede definir un subconjunto de los casos para su recodificacin. El cuadro de dilogo
Si los casos para esto es igual al que se describe para Contar apariciones.
148
Captulo 8
Valor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser el
mismo tipo de datos (numrico o de cadena) que el de las variables que se van recodificar.
Perdido por el sistema. Valores asignados por el programa cuando los valores de sus datos
no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un campo
numrico est vaco, o cuando no est definido un valor como resultado de un comando de
transformacin. Los valores numricos perdidos del sistema se muestran como puntos. Las
variables de cadena no pueden tener valores perdidos del sistema, ya que es lcito cualquier
carcter en las variables de cadena.
Perdido por el sistema o por el usuario. Observaciones que tienen valores que el usuario ha
declarado perdidos o que son desconocidos y se les ha asignado el valor perdido del sistema,
lo que se indica mediante un punto (.).
Todos los dems valores. Cualquier valor no incluido en una de las especificaciones de la lista
Valor. Valor en el que se va a recodificar uno o ms valores antiguos. El tipo de datos (numrico
o de cadena) del valor introducido debe coincidir con el tipo de datos del valor antiguo.
Perdido por el sistema. Recodifica el valor antiguo especificado como valor perdido por el
sistema. El valor perdido por el sistema no se utiliza en los clculos. Adems, los casos
con valor perdido por el sistema se excluyen de muchos procedimientos. No disponible
para variables de cadena.
Copiar los valores antiguos. Retiene el valor antiguo. Si algunos de los valores no requieren la
recodificacin, utilice esta opcin para incluir los valores antiguos. Cualquier valor antiguo
que no se especifique no se incluye en la nueva variable, y los casos con esos valores se
asignan al valor perdido por el sistema en la nueva variable.
Las variables de los resultados son cadenas. Define la nueva variable recodificada como variable
en valores numricos. A las cadenas que contengan cualquier elemento que no sea nmero y un
carcter de signo opcional (+ -), se les asignar el valor perdido por el sistema.
149
Transformaciones de los datos
variable o las variables. Puede aadir, cambiar y borrar las especificaciones que desee. La lista se
ordena automticamente basndose en la especificacin del valor antiguo y siguiendo este orden:
valores nicos, valores perdidos, rangos y todos los dems valores. Si cambia una especificacin
de recodificacin en la lista, el procedimiento volver a ordenar la lista automticamente, si fuera
necesario, para mantener este orden.
Figura 8-11
Cuadro de dilogo Valores antiguos y nuevos
Recodificacin automtica
El cuadro de dilogo Recodificacin automtica le permite convertir los valores numricos y de
cadena en valores enteros consecutivos. Si los cdigos de la categora no son secuenciales, las
casillas vacas resultantes reducen el rendimiento e incrementan los requisitos de memoria de
muchos procedimientos. Adems, algunos procedimientos no pueden utilizar variables de cadena
y otros requieren valores enteros consecutivos para los niveles de los factores.
150
Captulo 8
Figura 8-12
Cuadro de dilogo Recodificacin automtica
La nueva variable, o variables, creadas por la recodificacin automtica conservan todas las
etiquetas de variable y de valor definidas de la variable antigua. Para los valores que no
tienen una etiqueta de valor ya definida se utiliza el valor original como etiqueta del valor
recodificado. Una tabla muestra los valores antiguos, los nuevos y las etiquetas de valor.
Los valores de cadena se recodifican por orden alfabtico, con las maysculas antes que
las minsculas.
Los valores perdidos se recodifican como valores perdidos mayores que cualquier valor no
perdido y conservando el orden. Por ejemplo, si la variable original posee 10 valores no
perdidos, el valor perdido mnimo se recodificar como 11, y el valor 11 ser un valor perdido
para la nueva variable.
Usar el mismo esquema de recodificacin para todas las variables. Esta opcin le permite aplicar un
nico esquema de recodificacin para todas las variables seleccionadas, lo que genera un esquema
de codificacin coherente para todas las variables nuevas.
Si selecciona esta opcin, se aplican las siguientes reglas y limitaciones:
Todas las variables deben ser del mismo tipo (numricas o de cadena).
Todos los valores observados para todas las variables seleccionadas se utilizan para crear un
orden de valores para recodificar en enteros consecutivos.
Los valores perdidos definidos por el usuario para las variables nuevas se basan en la primera
variable de la lista con valores perdidos definidos por el usuario. El resto de los valores de las
dems variables originales, excepto los valores perdidos del sistema, se consideran vlidos.
151
Transformaciones de los datos
Trate los valores de cadena en blanco como valores perdidos definidos por el usuario. En el caso de
las variables de cadena, los valores en blanco o nulos no son tratados como valores perdidos del
sistema. Esta opcin recodifica automticamente las cadenas en blanco en un valor definido por
el usuario mayor que el valor no perdido mximo.
Plantillas
La plantilla contiene informacin que asigna los valores no perdidos originales a los valores
recodificados.
Aplicar plantilla desde. Aplica una plantilla de recodificacin automtica previamente guardada a
las variables seleccionadas para la recodificacin, aade los valores adicionales encontrados en las
variables al final del esquema y conserva la relacin entre los valores originales y recodificados
automticamente almacenados en el esquema guardado.
Todas las variables seleccionadas para la recodificacin deben ser del mismo tipo (numricas
o de cadena) y dicho tipo debe coincidir con el tipo definido en la plantilla.
Las plantillas no pueden contener informacin sobre los valores perdidos definidos por el
usuario. Los valores perdidos definidos por el usuario para las variables de destino se basan
en la primera variable de la lista de variables originales con valores perdidos definidos por
el usuario. El resto de los valores de las dems variables originales, excepto los valores
perdidos del sistema, se consideran vlidos.
152
Captulo 8
Las asignaciones de valores de la plantilla se aplican en primer lugar. Los valores restantes
se recodifican en valores superiores al ltimo valor de la plantilla, con los valores perdidos
definidos por el usuario (basados en la primera variable de la lista con valores perdidos
definidos por el usuario) recodificados en valores superiores al ltimo valor vlido.
153
Transformaciones de los datos
Figura 8-13
Cuadro de dilogo Asignar rangos a los casos
distribucin exponencial.
Rango fraccional. El valor de la nueva variable es igual al rango dividido por la suma de las
ponderaciones de los casos no perdidos.
Rango fraccional como porcentaje. Cada rango se divide por el nmero de casos que tienes valores
ponderaciones de los casos. La nueva variable es una constante para todos los casos del mismo
grupo.
154
Captulo 8
Ntiles. Los rangos se basan en los grupos percentiles, de forma que cada uno de los grupos
contenga aproximadamente el mismo nmero de casos. Por ejemplo, con 4 Ntiles se asignar un
rango 1 a los casos por debajo del percentil 25, 2 a los casos entre los percentiles 25 y 50, 3 a los
casos entre los percentiles 50 y 75, y 4 a los casos por encima del percentil 75.
Estimaciones de proporcin. Estimaciones de la proporcin acumulada de la distribucin que
normales se pueden seleccionar las frmulas de estimacin de la proporcin: Blom, Tukey, Rankit
o Van der Waerden.
proporcin, las cuales utilizan la frmula (r-3/8) / (w+1/4), donde r es el rango y w es la suma
de las ponderaciones de los casos.
que va de 1 a w.
Van der Waerden. La transformacin de Van de Waerden, definida por la frmula r/(w+1),
155
Transformaciones de los datos
Figura 8-15
Cuadro de dilogo Asignar rangos a los casos: Empates
La tabla siguiente muestra cmo los distintos mtodos asignan rangos a los valores empatados.
Valor
Media
Menor
Mayor
Secuencial
10
15
15
15
16
20
156
Captulo 8
Figura 8-16
Pantalla principal del Asistente para fecha y hora
Aprender cmo se representan las fechas y las horas. Esta opcin ofrece una pantalla en la que
se presenta una breve descripcin de las variables de fecha/hora en SPSS Statistics. El botn
Ayuda tambin proporciona un vnculo para obtener informacin ms detallada.
Crear una variable de fecha/hora a partir de una cadena que contiene una fecha o una hora. Use
esta opcin para crear una variable de fecha/hora a partir de una variable de cadena. Por
ejemplo, dispone de una variable de cadena que representa fechas con el formato mm/dd/aaaa
y desea crear una variable de fecha/hora a partir de ella.
Crear una variable de fecha/hora fusionando variables que contengan partes diferentes de la
fecha u hora. Esta opcin permite construir una variable de fecha/hora a partir de un conjunto
de variables existentes. Por ejemplo, dispone de una variable que representa el mes (como un
nmero entero), una segunda que representa el da del mes y una tercera que representa el
ao. Se pueden combinar estas variables en una nica variable de fecha/hora.
Realizar clculos con fechas y horas. Use esta opcin para aadir o sustraer valores a variables
Extraer una parte de una variable de fecha/hora. Esta opcin permite extraer parte de una
variable de fecha/hora, como el da del mes de una variable de fecha/hora, con el formato
mm/dd/aaaa.
Asignar periodicidad a un conjunto de datos. Esta opcin presenta el cuadro de dilogo Definir
fechas, que se usa para crear variables de fecha/hora compuestas por un conjunto de fechas
secuenciales. Esta caracterstica se usa generalmente para asociar fechas con datos de serie
temporal.
157
Transformaciones de los datos
Nota: las tareas se desactivan cuando el conjunto de datos carece de los tipos de variables
necesarios para completar la tarea. Por ejemplo, si el conjunto de datos no contiene variables de
cadena, la tarea de creacin de una variable de fecha/hora a partir de una cadena no se aplica
y se desactiva.
fecha, como mm/dd/aaaa. Las variables de fecha/hora tienen un formato que representa una fecha
y una hora, como dd-mmm-aaaa hh:mm:ss. Internamente, las variables de fecha y de fecha/hora
se almacenan como el nmero de segundos a partir del 14 de octubre de 1582. Las variables de
fecha y de fecha/hora se denominan a menudo variables con formato de fecha.
Las especificaciones de ao reconocidas son tanto de dos como de cuatro dgitos. Por defecto,
los aos representados por dos dgitos representan un intervalo que comienza 69 aos antes de
la fecha actual y finaliza 30 aos despus de la fecha actual. Este intervalo est determinado
por la configuracin de las Opciones y se puede modificar (en el men Edicin, seleccione
Opciones y pulse en la pestaa Datos).
Los delimitadores que se pueden usar en los formatos de da-mes-ao son guiones, puntos,
comas, barras y espacios en blanco.
Variables de duracin. Las variables de duracin tienen un formato que representa una duracin
de tiempo, como hh:mm. Se almacenan internamente como segundos sin hacer referencia a
ninguna fecha en particular.
158
Captulo 8
Fecha y hora actuales. La variable del sistema $TIME contiene la fecha y hora actuales. Representa
E En la lista Variables, seleccione la variable de cadena que desee convertir. Observe que la lista
representa las fechas. La lista Valores de ejemplo muestra los valores reales de la variable
seleccionada en el archivo de datos. Los valores de la variable de cadena que no se ajusten al
patrn seleccionado darn como resultado un valor perdido del sistema para la nueva variable.
159
Transformaciones de los datos
E Escriba un nombre para la variable de resultado. ste no puede coincidir con el de una variable
existente.
Si lo desea, puede:
160
Captulo 8
No se puede utilizar una variable de fecha/hora existente como una de las partes de la variable
de fecha/hora final que se est creando. Las variables que componen las partes de la nueva
variable de fecha/hora deben ser nmeros enteros. La excepcin es el uso permitido de una
variable de fecha/hora existente como la parte de los segundos de la nueva variable. Puesto
que se permite el uso de fracciones de segundos, las variables utilizadas para los segundos no
tiene que ser obligatoriamente un nmero entero.
Los valores de cualquier parte de la nueva variable que no se ajusten al rango permitido darn
como resultado un valor perdido del sistema para la nueva variable. Por ejemplo, si se usa
inadvertidamente una variable que representa un da del mes como valor de Mes, todos los
casos en que el valor del da del mes pertenezca al rango 1431 se considerarn valores
perdidos del sistema para la nueva variable, puesto que el rango vlido para los meses en
SPSS Statistics es 113.
161
Transformaciones de los datos
E Escriba un nombre para la variable de resultado. ste no puede coincidir con el de una variable
existente.
E Seleccione un formato de fecha/hora de la lista Formato de resultado.
Si lo desea, puede:
162
Captulo 8
Seleccin del tipo de clculo que realizar con las variables de fecha/hora
Figura 8-21
Adicin o sustraccin de valores de variables de fecha/hora, paso 1
Aadir o sustraer una duracin a una fecha. Use esta opcin para aadir o sustraer valores a
una variable con formato de fecha. Si lo desea, puede aadir o sustraer duraciones que sean
valores fijos, como 10 das, o los valores de una variable numrica (por ejemplo, una variable
que represente aos).
Calcular el nmero de unidades de tiempo entre dos fechas. Use esta opcin para obtener la
diferencia entre dos fechas medidas en una unidad seleccionada. Por ejemplo, puede obtener
el nmero de aos o el nmero de das que separan dos fechas.
Sustraer dos duraciones. Use esta opcin para obtener la diferencia entre dos variables con
163
Transformaciones de los datos
variables utilizadas para las duraciones no pueden ser variables de fecha o de fecha/hora. Pueden
ser variables de duracin o variables numricas simples.
E Seleccione la unidad que represente la duracin en la lista desplegable. Seleccione Duracin si se
usa una variable y sta tiene el formato de una duracin, como hh:mm o hh:mm:ss.
164
Captulo 8
E Escriba un nombre para la variable de resultado. ste no puede coincidir con el de una variable
existente.
Si lo desea, puede:
165
Transformaciones de los datos
Tratamiento de resultado
Truncar a nmero entero. Se ignora cualquier parte fraccional del resultado. Por ejemplo, si se
resta 28/10/2006 de 21/10/2007 se obtiene un resultado de 0 para los aos y 11 para los meses.
166
Captulo 8
periodos de tiempo que incluyen aos bisiestos. Por ejemplo, si se resta 1/2/2008 de 1/3/2008
devuelve una diferencia fraccional de 0,95 meses, en comparacin con los 0,92 para el mismo
periodo de tiempo en un ao no bisiesto.
Fecha 1
Fecha 2
Meses
Aos
Truncado Redondeado
Fraccin
Truncado Redondeado
Fraccin
10/21/2006
10/28/2007
1.02
12
12
12.22
10/28/2006
10/21/2007
.98
11
12
11.76
2/1/2007
3/1/2007
.08
.92
2/1/2008
3/1/2008
.08
.95
3/1/2007
4/1/2007
.08
1.02
4/1/2007
5/1/2007
.08
.99
E Escriba un nombre para la variable de resultado. ste no puede coincidir con el de una variable
existente.
Si lo desea, puede:
167
Transformaciones de los datos
168
Captulo 8
E Escriba un nombre para la variable de resultado. ste no puede coincidir con el de una variable
existente.
E Seleccione un formato de duracin de la lista Formato de resultado.
Si lo desea, puede:
169
Transformaciones de los datos
E Seleccione la variable que contiene la parte de fecha u hora que desee extraer.
E En la lista desplegable, seleccione la parte de la variable que se va a extraer. Si lo desea, puede
extraer informacin de fechas que no sea explcitamente parte de la fecha que se muestra, por
ejemplo, un da de la semana.
170
Captulo 8
E Escriba un nombre para la variable de resultado. ste no puede coincidir con el de una variable
existente.
E Si est extrayendo la parte de fecha o de hora de una variable de fecha/hora, debe seleccionar
Generar variables de fecha para establecer la periodicidad y distinguir entre los perodos
histricos, de validacin y de prediccin.
Reemplazar valores definidos como perdidos por el usuario y perdidos del sistema con
estimaciones basadas en uno de los diversos mtodos existentes.
Una serie temporal se obtiene midiendo una variable (o un conjunto de variables) de manera
regular a lo largo de un perodo de tiempo. Las transformaciones de los datos de serie temporal
suponen una estructura de archivo de datos en la que cada caso (fila) representa un conjunto de
observaciones para un momento diferente y la duracin del tiempo entre los casos es uniforme.
171
Transformaciones de los datos
Definir fechas
El cuadro de dilogo Definir fechas genera variables de fecha que se pueden utilizar para
establecer la periodicidad de una serie temporal y para etiquetar los resultados de los anlisis
de series temporales.
Figura 8-30
Cuadro de dilogo Definir fechas
Los casos son. Define el intervalo de tiempo utilizado para generar las fechas.
Sin fecha elimina las variables de fecha definidas anteriormente. Se eliminarn todas las
variables con los nombres siguientes: ao_, trimestre_, mes_, semana_, da_, hora_, minuto_,
segundo_ y fecha_.
sintaxis de comandos (por ejemplo, una semana de cuatro das laborables). Este elemento
simplemente refleja el estado actual del conjunto de datos activo. Su seleccin en la lista
no produce ningn efecto.
El primer caso es. Define el valor de la fecha inicial, que se asigna al primer caso. A los casos
172
Captulo 8
173
Transformaciones de los datos
Figura 8-31
Cuadro de dilogo Crear serie temporal
originales.
E Seleccione la variable o variables a partir de las cuales desee crear nuevas variables de serie
Introducir nombres de variables, para omitir los nombres por defecto de las nuevas variables.
distanciados un orden (un lapso) de valores constante. El orden se basa en la periodicidad definida
actualmente. Para calcular diferencias estacionales debe haber definido variables de fecha (men
174
Captulo 8
Datos, Definir fechas) que incluyan un componente estacional (como por ejemplo los meses del
ao). El orden es el nmero de perodos estacionales utilizados para calcular la diferencia. El
nmero de casos con el valor perdido del sistema al comienzo de la serie es igual a la periodicidad
multiplicada por el orden de la diferencia estacional. Por ejemplo, si la periodicidad actual es 12 y
el orden es 2, los primeros 24 casos tendrn el valor perdido del sistema para la nueva variable.
Media mvil centrada. Se utiliza el promedio de un rango de los valores de la serie, que rodean e
incluyen al valor actual. La amplitud es el nmero de valores de la serie utilizados para calcular el
promedio. Si la amplitud es par, la media mvil se calcula con el promedio de cada par de medias
no centradas. Nmero de casos con el valor perdido del sistema al comienzo y al final de la serie
para una amplitud de n es igual a n/2 para los valores de la amplitud par y (n1)/2 para los valores
de la amplitud impar. Por ejemplo, si la amplitud es 5, el nmero de casos con el valor perdido del
sistema al comienzo y al final de la serie es 2.
Media mvil anterior. Se utiliza el promedio de un rango de las observaciones precedentes. La
amplitud es el nmero de valores precedentes de la serie utilizados para calcular el promedio.
El nmero de casos con el valor perdido del sistema al comienzo de la serie es igual al valor
de la amplitud.
Medianas mviles. Se utiliza la mediana de un rango de los valores de la serie, que rodean e
incluyen al valor actual. La amplitud es el nmero de valores de la serie utilizados para calcular la
mediana. Si la amplitud es par, la mediana se calcula con el promedio de cada par de medianas no
centradas. Nmero de casos con el valor perdido del sistema al comienzo y al final de la serie para
una amplitud de n es igual a n/2 para los valores de la amplitud par y (n1)/2 para los valores de
la amplitud impar. Por ejemplo, si la amplitud es 5, el nmero de casos con el valor perdido del
sistema al comienzo y al final de la serie es 2.
Suma acumulada. Cada valor de la serie se sustituye por la suma acumulada de los valores
suavizador comienza con una mediana mvil de 4, que se centra por una mediana mvil de 2. A
continuacin, se vuelven a suavizar estos valores aplicando una mediana mvil de 5, una mediana
mvil de 3 y los promedios ponderados mviles (hanning). Los residuos se calculan sustrayendo la
serie suavizada de la serie original. Despus se repite todo el proceso sobre los residuos calculados.
Por ltimo, los residuos suavizados se calculan sustrayendo los valores suavizados obtenidos la
primera vez que se realiz el proceso. A esto se le denomina a veces suavizado T4253H.
175
Transformaciones de los datos
Cada grado de diferenciacin estacional reduce la longitud de una serie en una estacin.
Si genera una serie nueva que contenga predicciones que sobrepasen el final de la serie
existente (al pulsar en el botn Guardar y realizar las selecciones adecuadas), la serie original
y la serie residual generada incluirn datos perdidos para las observaciones nuevas.
Los valores perdidos al principio o fin de una serie no suponen un problema especial;
sencillamente acortan la longitud til de la serie. Las discontinuidades que aparecen en mitad de
una serie (datos incrustados perdidos) pueden ser un problema mucho ms grave. El alcance del
problema depende del procedimiento analtico que se utilice.
El cuadro de dilogo Reemplazar valores perdidos crea nuevas variables de series temporales
a partir de otras existentes, reemplazando los valores perdidos por estimaciones calculadas
mediante uno de los distintos mtodos posibles. Los nombres por defecto de las nuevas variables
se componen de los seis primeros caracteres de las variables existentes utilizadas para crearlas,
seguidos por un carcter de subrayado y un nmero secuencial. Por ejemplo, para la variable
precio, el nombre de la nueva variable sera precio_1. Las nuevas variables conservaran cualquier
etiqueta de valor definida de las variables originales.
Figura 8-32
Cuadro de dilogo Reemplazar los valores perdidos
176
Captulo 8
Para reemplazar los valores perdidos para las variables de series temporales
E Elija en los mens:
Transformar
Reemplazar valores perdidos...
E Seleccione el mtodo de estimacin que desee utilizar para reemplazar los valores perdidos.
E Seleccione la variable o variables para las que desea reemplazar los valores perdidos.
Si lo desea, puede:
Introducir nombres de variables, para omitir los nombres por defecto de las nuevas variables.
vlidos circundantes. La amplitud de los puntos adyacentes es el nmero de valores vlidos, por
encima y por debajo del valor perdido, utilizados para calcular la mediana.
Interpolacin lineal. Sustituye los valores perdidos utilizando una interpolacin lineal. Se utilizan
para la interpolacin el ltimo valor vlido antes del valor perdido y el primer valor vlido
despus del valor perdido. Si el primer o el ltimo caso de la serie tiene un valor perdido, el
valor perdido no se sustituye.
Tendencia lineal en el punto. Reemplaza los valores perdidos de la serie por la tendencia lineal en
ese punto. Se hace una regresin de la serie existente sobre una variable ndice escalada de 1 a n.
Los valores perdidos se sustituyen por sus valores pronosticados.
solicitante y el prstamo en cuestin. La puntuacin del crdito obtenida a partir del modelo de
riesgo se usa para aceptar o rechazar la solicitud de prstamo.
La puntuacin se trata como una transformacin de los datos. El modelo se expresa internamente
como un conjunto de transformaciones numricas que se deben aplicar a un determinado conjunto
de variables (las variables predictoras especificadas en el modelo), con el fin de obtener un
177
Transformaciones de los datos
resultado predictivo. En este sentido, el proceso de puntuacin de los datos con un modelo dado
es, inherentemente, igual que la aplicacin de cualquier funcin, como puede ser una funcin de
raz cuadrada, a un conjunto de datos.
La puntuacin slo est disponible en SPSS Statistics Server y se puede realizar de forma
interactiva por los usuarios de en modo de anlisis distribuido . Para puntuar archivos de datos
de gran tamao, es posible que desee usar Batch Facility, un ejecutable independiente que se
distribuye junto con la versin de SPSS Statistics Server. Para obtener informacin acerca del uso
de Batch Facility, consulte el manual del usuario de Batch Facility, que se incluye como archivo
PDF en el CD del producto de la versin de SPSS Statistics Server.
El proceso de puntuacin consta de:
E Carga de un modelo de un archivo en formato XML (PMML).
E Calcular las puntuaciones como una variable nueva, mediante las funciones ApplyModel o
Nombre de comando
Opcin
Discriminante
DISCRIMINANT
Base
Regresin lineal
REGRESSION
Base
TWOSTEP CLUSTER
Base
GENLIN
Estadsticas
avanzadas
Muestras complejas
CSGLM
Modelo lineal general de muestras
complejas
Regresin logstica de muestras complejas CSLOGISTIC
Muestras complejas
CSORDINAL
Muestras complejas
Regresin logstica
LOGISTIC REGRESSION
Regresin
NOMREG
Regresin
rbol de decisin
TREE
rbol de decisin
178
Captulo 8
Figura 8-33
Resultado de la carga de modelos
E Escriba un nombre para asociarlo a este modelo. Cada modelo cargado debe tener un nombre
exclusivo.
E Pulse en Archivo y seleccione un archivo de modelo. El cuadro de dilogo Abrir archivo resultante
muestra los archivos disponibles en anlisis en modo distribuido. Esto incluye los archivos del
equipo donde se instal el SPSS Statistics Server y los archivos del equipo local que se encuentran
en carpetas compartidas o en unidades compartidas.
Nota: Al puntuar datos, el modelo se aplica a las variables del conjunto de datos activo con los
mismos nombres que las variables del archivo de modelo. Puede asignar variables del modelo
original a otras variables del conjunto de datos activo mediante la sintaxis de comandos (consulte
el comando MODEL HANDLE).
179
Transformaciones de los datos
Nombre. Nombre utilizado para identificar este modelo. Las normas para los nombres de modelo
vlidos son las mismos que para los nombres de las variables (consulte Nombres de variable en
Captulo 5 el p. 79), con la adicin del carcter $ como un primer carcter permitido. Este nombre
se utiliza para especificar el modelo cuando se puntan los datos con las funciones ApplyModel o
StrApplyModel.
Archivo. El archivo XML (PMML) que contiene las especificaciones del modelo.
Valores perdidos
Este grupo de opciones controla el tratamiento de los valores perdidos, que se encuentran durante
el proceso de puntuacin, para las variables predictoras del modelo. Un valor perdido en el
contexto de puntuacin hace referencia a:
Una variable predictora no contiene ningn valor. Para las variables numricas, esto significa
el valor perdido del sistema. Para las variables de cadena, esto significa una cadena nula.
El valor se ha definido como perdido por el usuario, en el modelo, para el predictor dado. Los
valores definidos como perdidos por el usuario en el conjunto de datos activo, pero no en el
modelo, no se tratan como valores perdidos en el proceso de puntuacin.
Usar sustitucin de valores. Puede utilizar la sustitucin de valores cuando punte casos con
valores perdidos. El mtodo para determinar el valor que sustituye a un valor perdido depende del
tipo de modelo predictivo.
SPSS Statistics Modelos. Para las variables independientes en modelos de regresin lineal y
discriminantes, si se especific la sustitucin por el valor medio para los valores perdidos
cuando se gener y guard el modelo, dicho valor medio se utiliza en lugar del valor perdido
en el clculo de puntuacin y la puntuacin contina. Si el valor medio no est disponible, el
valor perdido del sistema se devuelve.
Modelos de AnswerTree y modelos del comando TREE. Para los modelos CHAID y CHAID
exhaustivo, se selecciona el nodo filial de mayor tamao para una variable de segmentacin
perdida. El nodo filial de mayor tamao es el que tiene mayor poblacin entre los nodos
filiales que utilizan los casos de muestra de aprendizaje. Para los modelos C&RT y QUEST,
las variables de segmentacin sustitutas (si las hay) se utilizan primero. (Las divisiones
sustitutas son divisiones que intentan coincidir con la divisin original tanto como sea posible
utilizando predictores alternativos.) Si no se especifica ninguna divisin sustituta o todas las
variables de segmentacin sustitutas corresponden a valores perdidos, se utiliza el nodo
filial de mayor tamao.
Modelos Clementine. Los modelos de regresin lineal se tratan como se describe en los
modelos de SPSS Statistics. Los modelos de regresin logstica se tratan como se describe en
los modelos de regresin logstica. Los modelos de rbol C&RT se tratan como se describe
para los modelos C&RT bajo los modelos de AnswerTree.
Modelos de regresin logstica. Para las covariables de los modelos de regresin logstica, si
un valor medio del predictor se incluye como parte del modelo guardado, este valor medio se
utiliza en lugar del valor perdido en el clculo de puntuacin y la puntuacin contina. Si el
predictor es categrico (por ejemplo, un factor en un modelo de regresin logstica) o si el
valor medio no est disponible, se devolver el valor perdido del sistema.
180
Captulo 8
Usar perdido por el sistema. Devuelve el valor perdido por el sistema al puntuar un caso con
un valor perdido.
Esto generar una tabla de asas de modelo. La tabla contiene una lista de todos los modelos
cargados actualmente e incluye el nombre (denominado asa de modelo) asignado al modelo, el
tipo de modelo, la ruta de acceso al archivo de modelo y el mtodo para tratar los valores perdidos.
Figura 8-35
Lista de modelos cargados
Asignar variables del modelo original a distintas variables del conjunto de datos activo (con
el subcomando MAP). Por defecto, el modelo se aplica a las variables del conjunto de datos
activo con los mismos nombres que las variables del archivo de modelo.
Captulo
Los archivos de datos no siempre estn organizados de la forma ideal para las necesidades
especficas del usuario. Puede que le interese combinar archivos de datos, organizar los datos en
un orden diferente, seleccionar un subconjunto de casos o cambiar la unidad de anlisis agrupando
casos. Entre la amplia gama de posibilidades de transformacin de archivos disponibles se
encuentran las siguientes:
Ordenar datos. Puede ordenar los casos en funcin del valor de una o ms variables.
Transponer casos y variables. El formato de archivo de datos SPSS Statistics lee las filas como
casos y las columnas como variables. Para los archivos de datos en los que el orden est invertido,
se pueden intercambiar las filas y las columnas para leer los datos en el formato correcto.
Fundir archivos. Puede fundir dos o ms archivos de datos. Es posible combinar archivos con las
mismas variables pero con casos distintos, o con los mismos casos pero variables diferentes.
Seleccionar subconjuntos de casos. Puede restringir el anlisis a un subconjunto de casos o
ms variables de agrupacin.
Ponderar datos. Puede ponderar los casos para un anlisis basado en el valor de una variable
de ponderacin.
Reestructurar datos. Puede reestructurar los datos para crear un nico caso (registro) a partir de
Ordenar casos
Este cuadro de dilogo ordena los casos (las filas) del archivo de datos basndose en los valores de
una o ms variables de ordenacin. Puede ordenar los casos en orden ascendente o descendente.
Si selecciona ms de una variable de ordenacin, los casos se ordenarn por variable dentro de
las categoras de la variable anterior de la lista Ordenar por. Por ejemplo, si selecciona Sexo
como la primera variable de ordenacin y Minora como la segunda, los casos se ordenarn
por minoras dentro de cada categora de sexo.
La secuencia de ordenacin est basada en el orden definido de forma regional (y no tiene por
qu ser igual al orden numrico de los cdigos de caracteres). La configuracin regional por
defecto es la configuracin regional del sistema operativo. Puede controlar la configuracin
181
182
Captulo 9
regional con el ajuste Idioma de la pestaa General del cuadro de dilogo Opciones (men
Edicin).
Figura 9-1
Cuadro de dilogo Ordenar casos
Ordenar variables
Puede ordenar las variables del conjunto de datos activo en funcin de los valores de cualquiera de
los atributos de variable (por ejemplo, nombre de la variable, tipo de variable, tipo de datos, nivel
de medida), incluidos los atributos de variable personalizados.
183
Gestin y transformacin de los archivos
E En los mens de la Vista de variables o Vista de datos, elija:
Datos
Ordenar variables
E Seleccione el atributo que desea utilizar para ordenar variables.
E Seleccione el orden de orden (ascendente o descendente).
Figura 9-2
Cuadro de dilogo Ordenar variables
Transponer
Transponer crea un archivo de datos nuevo en el que se transponen las filas y las columnas del
archivo de datos original de manera que los casos (las filas) se convierten en variables, y las
variables (las columnas) se convierten en casos. Tambin crea automticamente nombres de
variable y presenta una lista de dichos nombres.
Se crea automticamente una nueva variable de cadena, case_lbl, que contiene el nombre
de variable original.
184
Captulo 9
Si el conjunto de datos activo contiene una variable de identificacin o de nombre con valores
nicos, podr utilizarla como variable de nombre: sus valores se emplearn como nombres de
variable en el archivo de datos transpuesto. Si se trata de una variable numrica, los nombres
de variable comenzarn por la letra V, seguida de un valor numrico.
Los valores perdidos definidos por el usuario se convierten en el valor perdido del sistema en
el archivo de datos transpuesto. Para conservar cualquiera de estos valores, se debe cambiar la
definicin de los valores perdidos en la Vista de variables del Editor de datos.
Fundir el conjunto de datos activo con otro conjunto de datos abierto o archivo de datos SPSS
Statistics que contenga las mismas variables pero diferentes casos.
Fundir el conjunto de datos activo con otro conjunto de datos abierto o archivo de datos SPSS
Statistics que contenga los mismos casos pero diferentes variables.
185
Gestin y transformacin de los archivos
Aadir casos
Aadir casos fusiona el conjunto de datos activo con un segundo conjunto de datos o archivo de
datos SPSS Statistics externo que contenga las mismas variables (columnas) pero diferentes casos
(filas). Por ejemplo, podra registrar la misma informacin de los clientes de dos zonas de venta
diferentes y conservar los datos de cada zona en archivos distintos. El segundo conjunto de
datos puede ser un archivo de datos SPSS Statistics externo o un conjunto de datos disponible en
la sesin actual.
Figura 9-4
Cuadro de dilogo Aadir casos
Variables desemparejadas. Muestra las variables que se van a excluir del nuevo archivo de datos
fusionado. Las variables del conjunto de datos activo se identifican mediante un asterisco (*).
Las variables del otro conjunto de datos se identifican con un signo ms (+). Por defecto, la lista
contiene:
Las variables de cualquiera de los archivos de datos que no coincidan con un nombre de
variable del otro archivo. Puede crear pares a partir de variables desemparejadas e incluirlos
en el nuevo archivo fusionado.
Las variables definidas como datos numricos en un archivo y como datos de cadena en el
otro. Las variables numricas no pueden fusionarse con variables de cadena.
Variables de cadena de longitud diferente. El ancho definido de una variable de cadena debe
ser el mismo en ambos archivos de datos.
Variables del nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo archivo
de datos fusionado. Por defecto, la lista incluye todas las variables que coinciden en el nombre
y el tipo de datos (numricos o de cadena).
Puede eliminar de la lista las variables que no desee incluir en el archivo fusionado.
Las variables desemparejadas incluidas en el archivo fusionado contendrn los datos perdidos
para los casos del archivo que no contiene esa variable.
Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de origen. Esta
variable toma un valor 0 para los casos del conjunto de datos activo y un valor 1 para los casos del
archivo de datos externo.
186
Captulo 9
Para fundir archivos de datos con las mismas variables y casos diferentes
E Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios conjuntos de datos
abiertos, convierta uno de los conjuntos de datos que desea fusionar en el conjunto de datos activo.
Los casos de este archivo aparecern primero en el nuevo archivo de datos fusionado.
E Elija en los mens:
Datos
Fundir archivos
Aadir casos...
E Seleccione el conjunto de datos o el archivo de datos SPSS Statistics que va a fusionar con
incluir.
E Aada parejas de variables de la lista Variables desemparejadas que representen la misma
informacin registrada con nombres diferentes en los dos archivos. Por ejemplo, la fecha de
nacimiento podra tener el nombre de variable fechnac en un archivo y nacfech en el otro.
Para seleccionar una pareja de variables desemparejadas
E Pulse en una de las variables en la lista Variables desemparejadas.
E Mantenga pulsada la tecla Ctrl mientras selecciona la otra variable de la lista con el ratn (pulse
activo. (El nombre de variable del conjunto de datos activo se emplear como el nombre de
variable en el archivo fusionado.)
187
Gestin y transformacin de los archivos
Figura 9-5
Seleccin de parejas de variables mediante la tecla Ctrl
Utilizar el nombre de variable del otro conjunto de datos en lugar del nombre del conjunto de
datos activo para las parejas de variables.
Incluir dos variables con el mismo nombre pero de diferentes tipos o longitudes de cadena.
Por ejemplo, para incluir la variable numrica sexo del conjunto de datos activo y la variable
de cadena sexo del otro conjunto de datos, primero se debe cambiar el nombre de una de ellas.
Si alguna informacin del diccionario sobre una variable no est definida en el conjunto de
datos activo, se utilizar la informacin del diccionario del otro conjunto de datos.
Si el conjunto de datos activo contiene cualquier etiqueta de valor definida o valores definidos
como perdidos por el usuario para una variable, se ignorar cualquier otra etiqueta de valor o
valor definido como perdido por el usuario para esa variable en el otro conjunto de datos.
188
Captulo 9
Aadir variables
Aadir variables fusiona el conjunto de datos activo con otro conjunto de datos abierto o un
archivo de datos SPSS Statistics que contenga los mismos casos (filas) pero diferentes variables
(columnas). Por ejemplo, es posible que desee fusionar un archivo de datos que contenga los
resultados previos de la prueba con otro que contenga los resultados posteriores.
Los casos deben estar ordenados de la misma manera en ambos conjuntos de datos.
Si se utilizan una o ms variables clave para emparejar los casos, los dos conjuntos de datos
deben estar ordenados por orden ascendente de la variable o variables clave.
Los nombres de las variables del segundo archivo de datos que son duplicados de los del
conjunto de datos activo se excluyen por defecto, ya que Aadir variables supone que estas
variables contienen informacin duplicada.
Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de origen. Esta
variable toma un valor 0 para los casos del conjunto de datos activo y un valor 1 para los casos del
archivo de datos externo.
Figura 9-6
Cuadro de dilogo Aadir variables
189
Gestin y transformacin de los archivos
Variables excluidas. Muestra las variables que se van a excluir del nuevo archivo de datos
fusionado. Por defecto, la lista contiene los nombres de variable de otro conjunto de datos que son
duplicados de los del conjunto de datos. Las variables del conjunto de datos activo se identifican
mediante un asterisco (*). Las variables del otro conjunto de datos se identifican con un signo
ms (+). Si desea incluir en el archivo fusionado una variable excluida con un nombre duplicado,
cmbiele el nombre y adala a la lista de variables que se van a incluir.
Nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo conjunto de datos
fusionado. Por defecto, se incluyen en la lista todos los nombres de variable nicos que existan en
ambos conjuntos de datos.
Variables clave. Si algunos casos de un conjunto de datos no se emparejan con los del otro
conjunto de datos (es decir, si faltan casos en un conjunto de datos), utilice las variables clave
para identificar y emparejar correctamente los casos de ambos conjuntos de datos. Tambin puede
utilizar las variables clave segn tablas de claves.
Las variables clave deben tener los mismos nombres en ambos conjuntos de datos.
Ambos conjuntos de datos deben estar ordenados segn el orden ascendente de las variables
clave, y el orden de las variables de la lista Variables clave debe ser igual a su secuencia
de ordenacin.
Los casos que no se emparejan con las variables clave se incluyen en el archivo fusionado,
pero no se funden con los casos del otro archivo. Los casos no emparejados slo contienen
valores para las variables del archivo de procedencia; las variables del otro archivo contienen
el valor perdido del sistema.
El que no es conjunto de datos activo (o el conjunto de datos activo) es una tabla de claves. Una tabla
de claves, o tabla de referencia, es un archivo en el que los datos de cada caso se pueden
aplicar a varios casos del otro archivo de datos. Por ejemplo, si un archivo contiene informacin
sobre los diferentes miembros de la familia (como el sexo, la edad, la formacin) y el otro contiene
informacin global (como los ingresos totales, el nmero de miembros o la ubicacin), se puede
utilizar el archivo global como una tabla de referencia y aplicar los datos comunes de la familia a
cada uno de sus miembros en el archivo fusionado.
Para fundir archivos con los mismos casos pero variables diferentes
E Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios conjuntos de datos
abiertos, convierta uno de los conjuntos de datos que desea fusionar en el conjunto de datos activo.
E Elija en los mens:
Datos
Fundir archivos
Aadir variables...
E Seleccione el conjunto de datos o el archivo de datos SPSS Statistics que va a fusionar con
190
Captulo 9
E Seleccione Emparejar los casos en las variables clave para los archivos ordenados.
E Aada las variables a la lista Variables clave.
Las variables clave deben existir en el conjunto de datos activo y en el otro conjunto de datos.
Ambos conjuntos de datos deben estar ordenados segn el orden ascendente de las variables clave,
y el orden de las variables de la lista Variables clave debe ser igual a su secuencia de ordenacin.
Agregar datos
Agregar datos agrega grupos de casos en el conjunto de datos activo en casos individuales y
crea un archivo nuevo agregado o variables nuevas en el conjunto de datos activo que contiene
los datos agregados. Los casos se agregan en funcin del valor de cero o ms variables de
segmentacin (agrupacin). Si no se han especificado variables de segmentacin, el conjunto de
datos completo es un grupo de segmentacin simple.
Si crea un archivo de datos agregado nuevo, dicho archivo de datos nuevo contiene un caso
para cada grupo definido por las variables de segmentacin. Por ejemplo, si hay una variable
de segmentacin con dos valores, el archivo de datos nuevo contiene slo dos casos. Si no se
especifica una variable de segmentacin, el nuevo archivo de datos contendr un caso.
191
Gestin y transformacin de los archivos
Figura 9-7
Cuadro de dilogo Agregar datos
Variables de segmentacin. Los casos se agrupan en funcin de los valores de las variables de
segmentacin. Cada combinacin nica de valores de variables de segmentacin define un grupo.
Al crear un archivo de datos agregados nuevo, todas las variables de segmentacin se guardan en
el archivo nuevo con sus nombres y la informacin del diccionario. Si se especifica la variable
de segmentacin, puede ser tanto numrica como de cadena.
Variables agregadas. Las variables de origen se utilizan con funciones agregadas para crear
variables agregadas nuevas. El nombre de la variable agregada viene seguido de una etiqueta de
variable opcional, el nombre de la funcin de agregacin y el nombre de la variable de origen
entre parntesis.
Puede anular los nombres por defecto de las variables agregadas con nuevos nombres de variable,
proporcionar etiquetas de variable descriptivas y cambiar las funciones empleadas para calcular
los valores de los datos agregados. Tambin puede crear una variable que contenga el nmero de
casos en cada grupo de segmentacin.
192
Captulo 9
casos para crear datos agregados. Si no se han especificado variables de segmentacin, el conjunto
de datos completo es un grupo de segmentacin simple.
E Seleccione una o varias variables para incluir.
E Seleccione una funcin de agregacin para cada variable agregada.
Puede aadir variables agregadas al conjunto de datos activo o crear un archivo de datos
agregados nuevo.
Aadir las variables agregadas al conjunto de datos activo. Las nuevas variables basadas en las
Crear un nuevo conjunto de datos que contenga nicamente las variables agregadas. Guarda los
datos agregados en un nuevo conjunto de datos durante la sesin actual. El conjunto de datos
incluye las variables de segmentacin que definen los casos agregados y todas las variables de
agregacin definidas por las funciones de agregacin. No afecta al conjunto de datos activo.
Escribir un nuevo archivo de datos que contenga slo las variables agregadas. Guarda los datos
En el caso de los archivos de datos muy grandes, puede resultar ms eficiente agregar datos
ordenados previamente.
El archivo ya est ordenado por las variables de segmentacin. Si los datos ya se han ordenados
Los datos se deben ordenar por valores de variables de segmentacin en el mismo orden que
las variables de segmentacin especificadas para el procedimiento Agregar datos.
Si va a aadir variables al conjunto de datos activo, seleccione slo esta opcin si los datos se
han ordenado mediante valores ascendentes de las variables de segmentacin.
Ordenar el archivo antes de la agregacin. En situaciones muy extraas y con archivos de datos
voluminosos, puede ser necesario ordenar el archivo de datos por los valores de las variables de
segmentacin antes de realizar la agregacin. No se recomienda esta opcin a menos que se
presenten problemas de memoria y/o rendimiento.
193
Gestin y transformacin de los archivos
Nmero de casos, incluyendo los no ponderados, los ponderados, los no perdidos y los
perdidos
Porcentaje o fraccin de los valores por encima o por debajo de un valor especificado
Figura 9-8
Cuadro de dilogo Funcin de agregacin
194
Captulo 9
Figura 9-9
Cuadro de dilogo Nombre y etiqueta de variable
Segmentar archivo
Segmentar archivo divide el archivo de datos en distintos grupos para el anlisis basndose en los
valores de una o ms variables de agrupacin. Si selecciona varias variables de agrupacin, los
casos se agruparn por variable dentro de las categoras de la variable anterior de la lista Grupos
basados en. Por ejemplo, si selecciona sexo como la primera variable de agrupacin y minora
como la segunda, los casos se agruparn por minoras dentro de cada categora de sexo.
Cada ocho bytes de una variable de cadena larga (variables de cadena que superan los ocho
bytes) cuenta como una variable hasta llegar al lmite de ocho variables de agrupacin.
Los casos deben ordenarse segn los valores de las variables de agrupacin, en el mismo
orden en el que aparecen las variables en la lista Grupos basados en. Si el archivo de datos
todava no est ordenado, seleccione Ordenar archivo segn variables de agrupacin.
Figura 9-10
Cuadro de dilogo Segmentar archivo
Comparar los grupos. Los grupos de segmentacin del archivo se presentan juntos para poder
compararlos. Para las tablas pivote se crea una sola tabla y cada variable de segmentacin del
archivo puede desplazarse entre las dimensiones de la tabla. En el caso de los grficos se crea un
grfico diferente para cada grupo y se muestran juntos en el Visor.
195
Gestin y transformacin de los archivos
Organizar los resultados por grupos. Los resultados de cada procedimiento se muestran por
Seleccionar casos
Seleccionar casos proporciona varios mtodos para seleccionar un subgrupo de casos basndose
en criterios que incluyen variables y expresiones complejas. Tambin se puede seleccionar una
muestra aleatoria de casos. Los criterios usados para definir un subgrupo pueden incluir:
Expresiones aritmticas
Expresiones lgicas
Funciones
Figura 9-11
Cuadro de dilogo Seleccionar casos
196
Captulo 9
Resultados
Esta seccin controla el tratamiento de casos no seleccionados. Puede elegir una de las siguientes
alternativas para tratar los casos no seleccionados:
Copiar casos seleccionados a un nuevo conjunto de datos. Los casos seleccionados se copiarn
a un nuevo conjunto de datos, lo que mantendr inalterado el conjunto de datos original. Los
casos no seleccionados no se incluirn en el nuevo conjunto de datos y se mantendrn en su
estado original en el conjunto de datos original.
datos. Slo se pueden recuperar los casos eliminados saliendo del archivo sin guardar ningn
cambio y abrindolo de nuevo. La eliminacin de los casos ser permanente si se guardan
los cambios en el archivo de datos.
Nota: Si elimina los casos no seleccionados y guarda el archivo, no ser posible recuperar estos
casos.
Para seleccionar un subconjunto de casos
E Elija en los mens:
Datos
Seleccionar casos...
E Seleccione uno de los mtodos de seleccin de casos.
E Especifique los criterios para la seleccin de casos.
197
Gestin y transformacin de los archivos
La mayora de las expresiones condicionales utilizan al menos uno de los seis operadores de
relacin (<, >, <=, >=, =, y ~=) de la calculadora.
198
Captulo 9
Figura 9-13
Cuadro de dilogo Seleccionar casos: Muestra aleatoria
Aproximadamente. Genera una muestra aleatoria con el porcentaje aproximado de casos indicado.
Dado que esta rutina toma una decisin pseudo-aleatoria para cada caso, el porcentaje de casos
seleccionados slo se puede aproximar al especificado. Cuantos ms casos contenga el archivo de
datos, ms se acercar el porcentaje de casos seleccionados al porcentaje especificado.
Exactamente. Un nmero de casos especificado por el usuario. Tambin se debe especificar el
nmero de casos a partir de los cuales se generar la muestra. Este segundo nmero debe ser
menor o igual que el nmero total de casos presentes en el archivo de datos. Si lo excede, la
muestra contendr un nmero menor de casos proporcional al nmero solicitado.
Los rangos de casos se basan en el nmero de fila que se muestra en el Editor de datos.
Los rangos de fechas y horas slo estn disponibles para los datos de serie temporal con
variables de fecha definidas (men Datos, Definir fechas).
Figura 9-14
Cuadro de dilogo Seleccionar casos: Rango para rangos de casos (sin variables de fecha definidas)
Figura 9-15
Cuadro de dilogo Seleccionar casos: Rango para datos de la serie temporal con variables de fecha
definidas
199
Gestin y transformacin de los archivos
Ponderar casos
Ponderar casos proporciona a los casos diferentes ponderaciones (mediante una rplica simulada)
para el anlisis estadstico.
Los casos con valores perdidos, negativos o cero para la variable de ponderacin se excluyen
del anlisis.
Los valores fraccionarios son vlidos y algunos procedimientos, como Frecuencias, Tablas
de contingencia y Tablas personalizadas, utilizan valores de ponderacin fraccionaria. Sin
embargo, la mayora de los procedimientos consideran la ponderacin de variables una
ponderacin de replicacin y simplemente redondean las ponderaciones fraccionarias al
nmero entero ms cercano. Algunos procedimientos ignoran por completo la variable de
ponderacin, y esta limitacin se indica en la documentacin especfica del procedimiento.
Figura 9-16
Cuadro de dilogo Ponderar casos
Si aplica una variable de ponderacin, sta seguir vigente hasta que se seleccione otra o se
desactive la ponderacin. Si guarda un archivo de datos ponderado, la informacin de ponderacin
se guardar con el archivo. Puede desactivar la ponderacin en cualquier momento, incluso
despus de haber guardado el archivo de forma ponderada.
Ponderaciones en las tablas de contingencia. El procedimiento Tablas de contingencia cuenta
con diversas opciones para el tratamiento de ponderaciones de los casos. Si desea obtener ms
informacin, consulte Tablas de contingencia: Mostrar en las casillas en Captulo 18 el p. 310.
Ponderaciones en los diagramas de dispersin y los histogramas. Los diagramas de dispersin y
los histogramas tienen una opcin para activar y desactivar las ponderaciones de los casos, pero
dicha opcin no afecta a los casos que tienen un valor negativo, un valor 0 o un valor perdido
para la variable de ponderacin. Estos casos permanecen excluidos del grfico incluso si se
desactiva la ponderacin desde el grfico.
Para ponderar casos
E Elija en los mens:
Datos
Ponderar casos...
200
Captulo 9
E Seleccione Ponderar casos mediante.
E Seleccione una variable de frecuencia.
Los valores de la variable de frecuencia se utilizan como ponderaciones de los casos. Por ejemplo,
un caso con un valor 3 para la variable de frecuencia representar tres casos en el archivo de
datos ponderado.
Si lo desea, puede:
Crear variables de identificacin, que permitirn un seguimiento de un valor del nuevo archivo
a partir de un valor del archivo original
201
Gestin y transformacin de los archivos
Figura 9-17
Asistente de reestructuracin de datos
los datos, de grupos de columnas relacionadas y desee que aparezcan en el nuevo archivo
de datos como grupos de filas. Si elige esta opcin, el asistente mostrar los pasos para
Variables a casos.
en los datos, de grupos de filas relacionadas y desee que aparezcan en el nuevo archivo de
datos como grupos de columnas. Si elige esta opcin, el asistente mostrar los pasos para
Casos a variables.
Transponer todos los datos. Seleccione esta opcin cuando desee transponer los datos. Todas
las filas se convertirn en columnas y todas las columnas en filas, en el nuevo archivo de
datos. Esta opcin cierra el Asistente de reestructuracin de datos y abre el cuadro de dilogo
Transponer datos.
202
Captulo 9
Una variable contiene informacin que se desea analizar, por ejemplo, una medida o una
puntuacin. Un caso es una observacin, por ejemplo, un individuo. En una estructura de datos
simple, cada variable es una nica columna de datos y cada caso es una nica fila. De manera
que, por ejemplo, si estuviera midiendo las puntuaciones de un examen realizado a todos los
alumnos de una clase, todos los valores de las notas apareceran en una nica columna y habra
una fila para cada alumno.
Cuando se analizan datos, a menudo se est analizando cmo vara una variable en funcin de
cierta condicin. Dicha condicin puede ser un tratamiento experimental especfico, un grupo
demogrfico, un momento en el tiempo u otra cosa. En el anlisis de datos, a las condiciones de
inters a menudo se las denomina factores. Al analizar factores, se dispone de una estructura de
datos compleja. Es posible que haya informacin acerca de una variable en ms de una columna
de datos (por ejemplo, una columna para cada nivel de un factor), o que haya informacin acerca
de un caso en ms de una fila (por ejemplo, una fila para cada nivel de un factor). El Asistente de
reestructuracin de datos le ayuda a reestructurar archivos con una estructura de datos compleja.
La estructura del archivo actual y la estructura que se desea en el nuevo archivo determinan las
elecciones que se deben seleccionar en el asistente.
Cmo estn organizados los datos en el archivo actual? Es posible que los datos actuales estn
organizados de manera que los factores estn registrados en una variable diferente (como grupos
de casos) o con la variable (como grupos de variables).
Grupos de casos. El archivo actual tiene registradas las variables y las condiciones en
factor
En este ejemplo, las dos primeras filas son un grupo de casos porque estn relacionadas.
Contienen datos para el mismo nivel del factor. En el anlisis de datos de SPSS Statistics,
cuando los datos estn estructurados de esta manera, se hace referencia al factor como variable
de agrupacin.
Grupos de columnas. El archivo actual tiene registradas las variables y las condiciones en
var_2
En este ejemplo, las dos primeras columnas son un grupo de variables porque estn relacionadas.
Contienen datos para la misma variable, var_1 para el nivel 1 del factor y var_2 para el nivel 2 del
factor. En el anlisis de datos de SPSS Statistics, si los datos se estructuran de esta manera, el
factor se suele denominar de medidas repetidas.
203
Gestin y transformacin de los archivos
Cmo deben organizarse los datos en el archivo nuevo? Normalmente, la organizacin estar
determinada por el procedimiento que se vaya a utilizar para analizar los datos.
Procedimientos que requieren grupos de casos. Los datos debern estructurarse en grupos de
casos para realizar los anlisis que requieran una variable de agrupacin. Algunos ejemplos
son: univariante, multivariante y componentes de la varianza de los Modelos lineales
generales; Modelos mixtos; Cubos OLAP; y muestras independientes de las Pruebas T o
Pruebas no paramtricas. Si la estructura de datos actual es de grupos de variables y desea
realizar estos anlisis, seleccione Reestructurar variables seleccionadas en casos.
Procedimientos que requieren grupos de variables. Los datos se debern estructurar en grupos
de variables para analizar medidas repetidas. Algunos ejemplos son: medidas repetidas de los
Modelos lineales generales, anlisis de covariables dependientes del tiempo del Anlisis de
regresin de Cox, muestras relacionadas de las Pruebas T o muestras relacionadas de las
Pruebas no paramtricas. Si la estructura de datos actual es de grupos de casos y desea realizar
estos anlisis, seleccione Reestructurar casos seleccionados en variables.
Se desea realizar una prueba t para muestras independientes. Se dispone de un grupo de columnas
compuesto por puntuacin_a y puntuacin_b, pero no se dispone de la variable de agrupacin
que requiere el procedimiento. Seleccione Reestructurar variables seleccionadas en casos en el
Asistente de reestructuracin de datos, reestructure un grupo de variables en una nueva variable
denominada puntuacin y cree un ndice denominado grupo. El nuevo archivo de datos se
muestra en la siguiente imagen.
Figura 9-19
Datos nuevos y reestructurados para variables a casos
Cuando se ejecute la prueba t para muestras independientes, podr utilizar grupo como variable
de agrupacin.
204
Captulo 9
Se desea realizar una prueba t para muestras relacionadas. La estructura de datos es de grupos de
casos, pero no se dispone de las medidas repetidas para las variables relacionadas que requiere
el procedimiento. Seleccione Reestructurar casos seleccionados en variables en el Asistente de
reestructuracin de datos, utilice id para identificar los grupos de filas en los datos actuales y
utilice tiempo para crear el grupo de variables en el nuevo archivo.
Figura 9-21
Datos nuevos y reestructurados para casos a variables
Cuando se ejecute la prueba t de muestras relacionadas, podr utilizar ant y des como el par de
variables.
en los datos actuales. Un grupo de columnas relacionadas, llamado grupo de variables, registra
medidas repetidas de la misma variable en distintas columnas. Por ejemplo, si en los datos
actuales hay tres columnas, c1, c2 y c3, que registran el contorno, entonces hay un grupo de
variables. Si adems hay otras tres columnas, a1, a2 y a3, que registran la altura, entonces
hay dos grupos de variables.
Cuntos grupos de variables debe haber en el archivo nuevo? Considere cuntos grupos de
variables desea que estn representados en el nuevo archivo de datos, teniendo en cuenta que no es
necesario reestructurar todos los grupos de variables en el nuevo archivo.
205
Gestin y transformacin de los archivos
Figura 9-22
Asistente de reestructuracin de datos: Nmero de grupos de variables, paso 2
Uno. El asistente crear una nica variable reestructurada en el nuevo archivo a partir de un
que se especifique afectar al siguiente paso, en el que el asistente crear de forma automtica
el nmero especificado de nuevas variables.
206
Captulo 9
Figura 9-23
Asistente de reestructuracin de datos: Seleccionar variables, paso 3
Cmo se deben identificar las nuevas filas? En el nuevo archivo de datos, puede crear una
variable que identifique la fila del archivo de datos actual que ha sido utilizada para crear un
grupo de filas nuevo. El identificador puede ser un nmero de caso secuencial o los valores de
una variable. Utilice los controles disponibles en el apartado Identificacin de grupos de casos
para definir la variable de identificacin utilizada en el nuevo archivo. Pulse en la casilla para
cambiar el nombre de variable por defecto y para dotar a la variable de identificacin de una
etiqueta de variable descriptiva.
Qu se debe reestructurar en el nuevo archivo? En el paso anterior, se informo al asistente del
nmero de grupos de variables que se deseaba reestructurar. El asistente cre una nueva variable
para cada grupo. Los valores para el grupo de variables aparecern en dicha variable en el
nuevo archivo. Utilice los controles en Variables que se van a transponer para definir la variable
reestructurada en el nuevo archivo.
207
Gestin y transformacin de los archivos
que se van a transponer. Todas las variables del grupo debern ser del mismo tipo (numricas o
de cadena).
Se puede incluir la misma variable ms de una vez en el grupo de variables (las variables se copian
de la lista origen de variables en lugar de moverlas); los valores se repetirn en el nuevo archivo.
Para especificar varias variables reestructuradas
E Seleccione la primera variable de destino que desea definir de la lista desplegable Variable
de destino.
E Ponga las variables que componen el grupo de variables que desea transformar en la lista Variables
que se van a transponer. Todas las variables del grupo debern ser del mismo tipo (numricas
o de cadena). Puede incluir la misma variable ms de una vez en el grupo de variables. (Las
variables se copian de la lista origen de variables en lugar de moverlas, y los valores se repetirn
en el nuevo archivo.)
E Seleccione la siguiente variable de destino que desea definir y repita el proceso de seleccin de
Aunque puede incluir la misma variable ms de una vez en el mismo grupo de variables de
destino, no puede incluir la misma variable en ms de un grupo de variables de destino.
Cada lista de grupos de variables de destino debe contener el mismo nmero de variables.
(Las variables que aparecen ms de una vez se incluyen en el recuento).
Debe definir los grupos de variables (seleccionando variables de la lista de origen) para todas
las variables de destino disponibles antes de poder pasar al siguiente paso.
Qu se debe copiar en el nuevo archivo? En el nuevo archivo se pueden copiar variables que no
se han reestructurado. Sus valores se propagarn en las nuevas filas. Desplace las variables que
desea copiar en el nuevo archivo en la lista Variables fijas.
208
Captulo 9
Figura 9-24
Asistente de reestructuracin de datos: Crear variables de ndice, paso 4
Cuntas variables de ndice debe haber en el archivo nuevo? Las variables de ndice se pueden
Ms de uno. El asistente crear varios ndices y deber introducir el nmero de ndices que
desea crear. El nmero especificado afectar al siguiente paso, en el que el asistente crea de
forma automtica el nmero especificado de ndices.
Ninguno. Seleccione esta opcin si no desea crear variables de ndice en el nuevo archivo.
209
Gestin y transformacin de los archivos
Figura 9-26
Datos nuevos y reestructurados con un ndice
El ndice comienza por 1 y se incrementa por cada variable del grupo. Vuelve a comenzar
cada vez que se encuentra una fila en el archivo original. Ahora se puede utilizar ndice en
procedimientos que requieran una variable de agrupacin.
Se va a reestructurar el grupo de variables en una nica variable, contorno, y se van a crear dos
ndices. Los nuevos datos se muestran en la siguiente tabla.
Figura 9-28
Datos nuevos reestructurados con los dos ndices
210
Captulo 9
En este paso, se debe decidir los valores que se desean para la variable de ndice. Los valores
pueden ser nmeros secuenciales o los nombres de las variables en un grupo de variables original.
Tambin puede especificar un nombre y una etiqueta para la nueva variable de ndice.
Figura 9-29
Asistente de reestructuracin de datos: Crear una variable de ndice, paso 5
Si desea obtener ms informacin, consulte Ejemplo de un ndice para variables a casos el p. 208.
valores ndice.
Nombres de variable. El asistente utilizar los nombres del grupo de variables seleccionado
Nombres y etiquetas. Pulse en una casilla para cambiar el nombre de variable por defecto y
211
Gestin y transformacin de los archivos
Figura 9-30
Asistente de reestructuracin de datos: Crear varias variables de ndice, paso 5
Si desea obtener ms informacin, consulte Ejemplo de dos ndices para variables a casos el p. 209.
Cuntos niveles hay registrados en el archivo actual? Calcule los niveles de factor que hay
registrados en los datos actuales. Un nivel define un grupo de casos que experimentan las
mismas condiciones. Si hay varios factores, los datos actuales se deben organizar de manera
que los niveles del primer factor sean un ndice primario dentro del cual varan los niveles
de los siguientes factores.
Cuntos niveles debe haber en el archivo nuevo? Introduzca el nmero de niveles para cada
ndice. Los valores para varias variables de ndice son siempre nmeros secuenciales. Los valores
comienzan en 1 y se incrementan con cada nivel. El primer ndice se incrementa ms despacio y el
ltimo ms deprisa.
Nmero total de niveles combinados. No se puede crear ms niveles de los que existen en los
datos actuales. Como los datos reestructurados contendrn una fila por cada combinacin de
tratamientos, el asistente realizar una comprobacin del nmero de niveles que se crean.
Comparar el producto de los niveles creados con el nmero de variables del grupo de variables.
Deben coincidir.
Nombres y etiquetas. Pulse en una casilla para cambiar el nombre de variable por defecto y
212
Captulo 9
En este paso, se deben especificar las opciones para el nuevo archivo reestructurado.
Figura 9-31
Asistente de reestructuracin de datos: Opciones, paso 6
3), se seleccionaron los grupos de variables que se iban a reestructurar, las variables que se
iban a copiar y una variable de identificacin de los datos actuales. Los datos de las variables
seleccionadas aparecern en el nuevo archivo. Si hay ms variables en los datos actuales, puede
elegir descartarlas o conservarlas.
Desea conservar los datos perdidos? El asistente comprueba cada nueva fila potencial en busca de
valores nulos. Un valor nulo es un valor en blanco o perdido por el sistema. Se puede elegir entre
conservar o descartar las filas que contienen slo valores nulos.
Desea crear una variable de recuento? El asistente puede crear una variable de recuento en el
nuevo archivo. Dicha variable contiene el nmero de nuevas filas generadas por una fila de los
datos actuales. Una variable de recuento puede ser de gran utilidad si decide descartar del nuevo
archivo los valores nulos, ya que esto conlleva la generacin de un nmero distinto de nuevas filas
por una fila dada de los datos actuales. Pulse en una casilla para cambiar el nombre de variable por
defecto y proporcionar una etiqueta de variable descriptiva para la variable de recuento.
213
Gestin y transformacin de los archivos
En este paso, se debe proporcionar informacin sobre cmo se van a utilizar las variables del
archivo actual en el nuevo archivo.
Figura 9-32
Asistente de reestructuracin de datos: Seleccionar variables, paso 2
Qu identifica los grupos de casos en los datos actuales? Un grupo de casos es un grupo de
filas relacionadas porque miden la misma unidad de observacin, por ejemplo, un individuo o
una institucin. El asistente necesita conocer cules son las variables del archivo actual que
identifican los grupos de casos para que se pueda consolidar cada grupo en una nica fila del
nuevo archivo. Desplace las variables que identifican grupos de casos en el archivo actual a la
lista de Variables de identificacin. Las variables que se utilizan para segmentar el archivo de
datos actual se utilizan de forma automtica para identificar los grupos de casos. Cada vez que
se encuentra una nueva combinacin de valores de identificacin, el asistente crear una nueva
fila, de manera que los casos del archivo actual debern ordenarse en funcin de los valores de
las variables de identificacin, en el mismo orden en el que aparecen las variables en la lista
Variables de identificacin. Si el archivo de datos actual no est an ordenado, podr hacerlo
en el siguiente paso.
Cmo deben crearse los nuevos grupos de variables en el archivo nuevo? En los datos originales,
una variable aparece en una nica columna. En el nuevo archivo de datos, dicha variable aparecer
en varias columnas. Las variables de ndice son variables existentes en los datos actuales que el
asistente deber utilizar para crear las nuevas columnas. Los datos reestructurados contendrn una
nueva variable por cada valor nico contenido en dichas columnas. Desplace a la lista Variables
de ndice las variables que se deben utilizar para formar los nuevos grupos de variables. Cuando el
asistente ofrezca opciones, tambin puede elegir ordenar las nuevas columnas por el ndice.
214
Captulo 9
Qu sucede con las dems columnas? El asistente decide de forma automtica lo que hay que
hacer con las variables que quedan en la lista Archivo actual. Comprueba cada variable para ver si
los valores de los datos varan dentro de un grupo de casos. Si hay alguna variacin, el asistente
reestructurar los valores en un grupo de variables en el nuevo archivo. Si no la hay, el asistente
copiar los valores en el nuevo archivo.
Cmo estn ordenadas las filas en el archivo actual? Tenga en cuenta la ordenacin de los datos
actuales y cules son las variables que se estn utilizando para identificar grupos de casos
(especificadas en el paso anterior).
identificacin, con el mismo orden en el que aparecen las variables en la lista Variables de
identificacin en el paso anterior. Seleccione esta opcin cuando los datos no estn ordenados
en funcin de las variables de identificacin o cuando no est seguro. Esta opcin requiere
215
Gestin y transformacin de los archivos
una lectura adicional de los datos, pero garantiza que las filas estn correctamente ordenadas
antes de la reestructuracin.
No. El asistente no ordenar los datos actuales. Seleccione esta opcin cuando est seguro
de que los datos actuales estn ordenados en funcin de las variables que identifican los
grupos de casos.
Por variable. El asistente agrupa juntas las nuevas variables creadas a partir de una variable
original.
Por ndice. El asistente agrupa las variables en funcin de los valores de las variables de ndice.
mes
216
Captulo 9
w.feb
h.ene
h.ene
w.feb
Desea crear una variable de recuento? El asistente puede crear una variable de recuento en el
nuevo archivo. Dicha variable contendr el nmero de filas de los datos actuales que se utilizaron
para crear una fila en el nuevo archivo de datos.
Desea crear variables indicadoras? El asistente puede utilizar las variables de ndice para crear
variables indicadoras en el nuevo archivo de datos. Crear una nueva variable por cada valor
nico de la variable de ndice. Las variables indicadoras indican la presencia o ausencia de un
valor para un caso. Una variable indicadora toma el valor 1 si el caso tiene un valor; en caso
contrario, vale 0.
Ejemplo. La variable de ndice es producto. Registra los productos que ha comprado un cliente.
Los datos originales son:
cliente
producto
pollo
huevos
huevos
pollo
La creacin de una variable indicadora da como resultado una nueva variable para cada valor
nico de producto. Los datos reestructurados son:
cliente
indpollo
indhuevos
En este ejemplo, se pueden utilizar los datos reestructurados para obtener recuentos de frecuencias
de los productos que compran los clientes.
217
Gestin y transformacin de los archivos
Figura 9-35
Asistente de reestructuracin de datos: Finalizar
Reestructurar los datos ahora. El asistente crear el nuevo archivo de datos reestructurado.
Pegar la sintaxis. El asistente pegar la sintaxis que ha generado en una ventana de sintaxis.
Seleccione esta opcin si no est preparado para reemplazar el archivo actual, si desea
modificar la sintaxis o si desea guardarla para utilizarla en el futuro.
Captulo
10
Cuando ejecute un procedimiento, los resultados se mostrarn en una ventana llamada Visor.
Desde esta ventana puede desplazarse con facilidad a los resultados que desee ver. Tambin puede
modificar los resultados y crear un documento que contenga exactamente los resultados que desee.
Visor
Los resultados se muestran en el Visor. Puede utilizar el Visor para:
Figura 10-1
Visor
218
219
Trabajo con resultados
Puede pulsar en un elemento de los titulares para dirigirse directamente a la tabla o al grfico
correspondiente. Puede pulsar y arrastrar el borde derecho del panel de titulares para cambiar la
anchura del mismo.
o
E Pulse en el elemento para seleccionarlo.
E Elija en los mens:
Ver
Ocult.
o
E Pulse en el icono de libro cerrado (Ocultar) de la barra de herramientas de titulares.
El icono de libro abierto (Mostrar) se convierte en el icono activo, indicando que el elemento
no est oculto.
220
Captulo 10
E Pulse la tecla Supr.
o
E Elija en los mens:
Edicin
Borrar
o
Formato
Centrado
o
Formato
Alinear a la derecha
221
Trabajo con resultados
Si se contrae la vista de titulares, se ocultarn los resultados de todos los elementos en los
niveles contrados.
o
E Pulse en el elemento de los titulares.
E Elija en los mens:
Ver
Contraer
o
Ver
Expandir
o
Edicin
Resaltado
Descender
222
Captulo 10
El cambio del nivel de titulares es particularmente til despus de mover elementos en el nivel de
titulares. El desplazamiento de elementos puede cambiar el nivel de titulares de los elementos
y puede utilizar los botones de flecha izquierda y derecha de la barra de herramientas de los
titulares para restaurar el nivel de titulares original.
o
Insertar
Nuevo texto
E Pulse dos veces en el nuevo objeto.
E Escriba el texto.
223
Trabajo con resultados
E Elija en los mens:
Insertar
Archivo de texto...
E Seleccione un archivo de texto.
o
Edicin
Reemplazar
Figura 10-2
Cuadro de dilogo Buscar y reemplazar
224
Captulo 10
Buscar elementos ocultos, incluidos los elementos ocultos del panel de contenido (por
ejemplo, las tablas Notas, que estn ocultas por defecto) y las filas y columnas ocultas
de las tablas pivote.
Restringir los criterios de bsqueda de las tablas pivote a coincidencias del contenido
completo de las casillas.
Las capas situadas por debajo de la capa visible actual de una tabla pivote multidimensional
no se consideran ocultas y se incluirn en el rea de bsqueda aunque no incluyan los
elementos ocultos en la bsqueda.
Los elementos ocultos incluyen elementos ocultos del panel de contenido (elementos con
iconos de libro cerrado en el panel de titulares o incluidos dentro de bloques plegados del
panel) y filas y columnas de las tablas pivote ocultas por defecto (por ejemplo, las filas y
columnas vacas) o manualmente mediante la edicin de la tabla y posterior seleccin de que
se desea ocultar determinadas filas y columnas. Los elementos ocultos slo se incluirn en la
bsqueda si selecciona de forma explcita Incluir elementos ocultos.
En ambos casos, se mostrarn los elementos ocultos o no visibles que contengan el texto o
valor de bsqueda, pero a continuacin volvern a su estado original.
formato RTF. En la mayora de las aplicaciones, esto significa que la tabla pivote se pega como
una tabla que puede editarse posteriormente en la otra aplicacin.
Nota: es posible que Microsoft Word no muestre correctamente las tablas muy anchas.
Mapa de bits. Los grficos de varios tipos se pueden pegar en otras aplicaciones como mapas
de bits.
225
Trabajo con resultados
BIFF. El contenido de una tabla se puede pegar en una hoja de clculo y conservar la precisin
numrica. Este formato slo est disponible en los sistemas operativos Windows.
Texto. El contenido de una tabla se puede copiar y pegar como texto. Este proceso puede ser til
en aplicaciones como el correo electrnico, donde slo se puede aceptar o transmitir texto.
Si la aplicacin de destino admite varios de los formatos disponibles, es posible que tenga un
elemento de men Pegado especial que le permita seleccionar el formato o que muestre de forma
automtica una lista de los formatos disponibles.
o
Edicin
Pegado especial...
que son demasiado anchas para el ancho del documento se ajustarn, reducirn su escala para
adaptarse al ancho del documento o permanecern inalteradas, dependiendo de la configuracin
de las opciones de las tablas pivote. Si desea obtener ms informacin, consulte Tabla pivote:
Opciones en Captulo 48 el p. 538.
Exportar resultados
La opcin Exportar resultados guardar los resultados del Visor en formato HTML, texto,
Word/RTF, Excel, PowerPoint (requiere PowerPoint 97 o posterior) y PDF. Los grficos se pueden
exportar tambin en varios formatos de grficos distintos.
Nota: la exportacin a PowerPoint slo est disponible en los sistemas operativos Windows y no
est disponible con la versin para estudiantes.
226
Captulo 10
exportacin.
Figura 10-3
Cuadro de dilogo Exportar resultados
Objetos para exportar. Permite exportar todos los objetos del Visor, todos los objetos visibles o
slo los objetos seleccionados.
Tipo de documento. Las opciones disponibles son:
Word/RTF (*.doc). Las tablas pivote se exportan como tablas de Word, con todos los atributos
de formato intactos (por ejemplo, bordes de casilla, estilos de fuente y colores de fondo). Los
resultados de texto se exportan en formato RTF. Los grficos, diagramas de rbol y vistas de
modelo se incluyen en formato PNG.
Nota: es posible que Microsoft Word no muestre correctamente las tablas muy anchas.
Excel (*.xls). Las filas, columnas y casillas de tablas pivote se exportan como filas, columnas y
casillas de Excel, con todos los atributos de formato intactos, por ejemplo, bordes de casilla,
estilos de fuente y colores de fondo, etc. Los resultados de texto se exportan con todos los
227
Trabajo con resultados
atributos de fuente intactos. Cada lnea del resultado de texto constituye una fila del archivo
de Excel y se incluye todo su contenido en una sola casilla. Los grficos, diagramas de rbol y
vistas de modelo se incluyen en formato PNG.
HTML (*.htm). Las tablas pivote se exportan como tablas HTML. Los resultados de texto se
exportan como formato previo de HTML. Los grficos, diagramas de rbol y vistas de modelo
se incrustan mediante referencias y deben exportarse en un formato adecuado para incluirlos
en los documentos HTML (por ejemplo, PNG y JPEG).
Formato de documento porttil (*.pdf). Todos los resultados es exportan como aparecen en la
Archivo PowerPoint (*.ppt). Las tablas pivote se exportan como tablas de Word y se incrustan
Texto (*.txt). Entre los formatos de resultados de texto se incluyen texto sin formato, UTF-8,
and UTF-16. Las tablas pivote se pueden exportar en formato separado por tabuladores o por
espacios. Todos los resultados de texto se exportan en formato separado por espacios. En los
grficos, diagramas de rbol y vistas de modelo, se inserta una lnea en el archivo de texto
para cada grfico, indicando el nombre de archivo de la imagen.
Ninguno (slo grficos). Los formatos de exportacin disponibles incluyen: EPS, JPEG, TIFF,
PNG y BMP. En los sistemas operativos Windows, tambin est disponible el formato EMF
(metarchivo mejorado).
Sistema de gestin de resultados. Puede exportar automticamente adems todos los resultados
o tipos de resultados especificados por el usuario como texto, Word, Excel, PDF, HTML, XML
y archivos de datos SPSS Statistics. Si desea obtener ms informacin, consulte Sistema de
gestin de resultados en Captulo 52 el p. 590.
Opciones de HTML
Las siguientes opciones estn disponibles para la exportacin de resultados en formato HTML:
Capas en tablas pivote. Por defecto, la inclusin o exclusin de las capas de una tabla pivote est
controlada por las propiedades de la tabla de cada tabla pivote. Puede anular este ajuste e incluir
todas las capas o excluir todas excepto la capa visible en ese momento. Si desea obtener ms
informacin, consulte Propiedades de tabla: Imprimiendo en Captulo 11 el p. 257.
Incluir notas y textos al pie. Controla la inclusin o exclusin de todas las notas y textos al pie de
la tabla pivote.
Vistas de modelos. De manera predeterminada, la inclusin o exclusin de vistas de modelos est
controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas
o excluirlas todas excepto la vista visible en ese momento. Si desea obtener ms informacin,
consulte Propiedades del modelo en Captulo 12 el p. 268. (Nota: todas las vistas de modelos,
incluidas las tablas, se exportan como grficos.)
228
Captulo 10
Nota: para HTML, tambin es posible controlar el formato de archivo de imagen de los grficos
exportados. Si desea obtener ms informacin, consulte Opciones de formato de grficos el p. 236.
Para configurar las opciones de exportacin de HTML
E Seleccione HTML como formato de exportacin.
E Pulse en Cambiar opciones.
Figura 10-4
Opciones de resultados de exportacin de HTML
Opciones de Word/RTF
Las siguientes opciones estn disponibles para la exportacin de resultados en formato Word:
Capas en tablas pivote. Por defecto, la inclusin o exclusin de las capas de una tabla pivote est
controlada por las propiedades de la tabla de cada tabla pivote. Puede anular este ajuste e incluir
todas las capas o excluir todas excepto la capa visible en ese momento. Si desea obtener ms
informacin, consulte Propiedades de tabla: Imprimiendo en Captulo 11 el p. 257.
Tablas pivote anchas. Controla la gestin de tablas que sean demasiado anchas para el ancho del
documento definido. De manera predeterminada, la tabla se ajusta hasta alcanzar el tamao
correcto. La tabla se divide en secciones y las etiquetas de fila se repiten en cada seccin de la
tabla. Tambin puede reducir tablas anchas o no hacer ningn cambio en las tablas anchas y dejar
que se extiendan ms all del ancho del documento definido.
Incluir notas y textos al pie. Controla la inclusin o exclusin de todas las notas y textos al pie de
la tabla pivote.
Vistas de modelos. De manera predeterminada, la inclusin o exclusin de vistas de modelos est
controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas
o excluirlas todas excepto la vista visible en ese momento. Si desea obtener ms informacin,
consulte Propiedades del modelo en Captulo 12 el p. 268. (Nota: todas las vistas de modelos,
incluidas las tablas, se exportan como grficos.)
229
Trabajo con resultados
Configuracin de pgina para exportacin. Esto abre un cuadro de dilogo donde puede definir el
tamao y los mrgenes de pgina del documento exportado. El ancho del documento utilizado
para determinar el ajuste o la reduccin de escala es el ancho de pgina menos los mrgenes
izquierdo y derecho.
Para configurar las opciones de exportacin de Word
E Seleccione Word/RTF como formato de exportacin.
E Pulse en Cambiar opciones.
Figura 10-5
Opciones de resultados de exportacin de Word
Opciones de Excel
Las siguientes opciones estn disponibles para la exportacin de resultados en formato Excel:
Cree una hoja o libro de trabajo o modifique una hoja de trabajo existente. De manera
230
Captulo 10
Si modifica una hoja de trabajo existente, los grficos, las vistas de modelo y los diagramas de
rbol no se incluyen en los resultados exportados.
Ubicacin en la hoja de trabajo. Controla la ubicacin de los resultados exportados dentro de la
hoja de trabajo. De manera predeterminada, los resultados exportados se aadirn detrs de la
ltima columna con contenido, empezando en la primera fila, sin modificar el contenido existente.
ste es un buen momento para aadir nuevas columnas a una hoja de trabajo existente. La
adicin de resultados exportados detrs de la ltima fila es una buena opcin para aadir nuevas
filas a una hoja de trabajo existente. La adicin de resultados exportados empezando desde una
ubicacin de casilla especfica sobrescribir el contenido existente en la zona donde se aadan
los resultados exportados.
Capas en tablas pivote. Por defecto, la inclusin o exclusin de las capas de una tabla pivote est
controlada por las propiedades de la tabla de cada tabla pivote. Puede anular este ajuste e incluir
todas las capas o excluir todas excepto la capa visible en ese momento. Si desea obtener ms
informacin, consulte Propiedades de tabla: Imprimiendo en Captulo 11 el p. 257.
Incluir notas y textos al pie. Controla la inclusin o exclusin de todas las notas y textos al pie de
la tabla pivote.
Vistas de modelos. De manera predeterminada, la inclusin o exclusin de vistas de modelos est
controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas
o excluirlas todas excepto la vista visible en ese momento. Si desea obtener ms informacin,
consulte Propiedades del modelo en Captulo 12 el p. 268. (Nota: todas las vistas de modelos,
incluidas las tablas, se exportan como grficos.)
Para configurar las opciones de exportacin de Excel
E Seleccione Excel como formato de exportacin.
E Pulse en Cambiar opciones.
231
Trabajo con resultados
Figura 10-6
Opciones de resultados de exportacin de Excel
Opciones de PowerPoint
Las siguientes opciones estn disponibles para PowerPoint:
Capas en tablas pivote. Por defecto, la inclusin o exclusin de las capas de una tabla pivote est
controlada por las propiedades de la tabla de cada tabla pivote. Puede anular este ajuste e incluir
todas las capas o excluir todas excepto la capa visible en ese momento. Si desea obtener ms
informacin, consulte Propiedades de tabla: Imprimiendo en Captulo 11 el p. 257.
Tablas pivote anchas. Controla la gestin de tablas que sean demasiado anchas para el ancho del
la tabla pivote.
Usar entradas de titulares del Visor como ttulos de diapositivas. Incluye un ttulo en cada diapositiva
creada en la exportacin. Cada diapositiva contiene un nico elemento exportado del Visor. El
ttulo se genera a partir de la entrada del titular para el elemento en el panel de titulares del Visor.
232
Captulo 10
controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas
o excluirlas todas excepto la vista visible en ese momento. Si desea obtener ms informacin,
consulte Propiedades del modelo en Captulo 12 el p. 268. (Nota: todas las vistas de modelos,
incluidas las tablas, se exportan como grficos.)
Configuracin de pgina para exportacin. Esto abre un cuadro de dilogo donde puede definir el
tamao y los mrgenes de pgina del documento exportado. El ancho del documento utilizado
para determinar el ajuste o la reduccin de escala es el ancho de pgina menos los mrgenes
izquierdo y derecho.
Para configurar las opciones de exportacin de PowerPoint
E Seleccione PowerPoint como formato de exportacin.
E Pulse en Cambiar opciones.
Figura 10-7
Cuadro de dilogo Opciones de exportacin de PowerPoint
Nota: la exportacin a PowerPoint slo est disponible en los sistemas operativos Windows.
233
Trabajo con resultados
Opciones de PDF
Las siguientes opciones estn disponibles para PDF:
Incrustar marcadores. Esta opcin incluye en el documento PDF los marcadores correspondientes
a las entradas de titulares del Visor. Al igual que el panel de titulares del Visor, los marcadores
pueden facilitar mucho la navegacin por los documentos que tienen un gran nmero de objetos
de resultados.
Incrustar fuentes. Al incrustar fuentes se garantiza que el documento PDF presentar el mismo
controlada por las propiedades de la tabla de cada tabla pivote. Puede anular este ajuste e incluir
todas las capas o excluir todas excepto la capa visible en ese momento. Si desea obtener ms
informacin, consulte Propiedades de tabla: Imprimiendo en Captulo 11 el p. 257.
Vistas de modelos. De manera predeterminada, la inclusin o exclusin de vistas de modelos est
controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas
o excluirlas todas excepto la vista visible en ese momento. Si desea obtener ms informacin,
consulte Propiedades del modelo en Captulo 12 el p. 268. (Nota: todas las vistas de modelos,
incluidas las tablas, se exportan como grficos.)
Para configurar las opciones de exportacin de PDF
E Seleccione Formato de documento porttil como formato de exportacin.
E Pulse en Cambiar opciones.
Figura 10-8
Cuadro de dilogo Opciones de PDF
234
Captulo 10
el contenido y la presentacin de los encabezados y pies de pgina, as como el tamao del grfico
impreso en los documentos PDF estn controlados por las opciones de configuracin de pgina y
las opciones de atributos de pgina.
Propiedades de tabla/Aspectos de tabla. El escalamiento de tablas largas o anchas y la impresin
de capas de tablas se controla mediante las propiedades de tabla. Estas propiedades tambin se
pueden guardar en Aspectos de tabla. Si desea obtener ms informacin, consulte Propiedades de
tabla: Imprimiendo en Captulo 11 el p. 257.
Impresora por defecto/actual. La resolucin (PPP) del documento PDF es la configuracin de la
resolucin actual para la impresora por defecto o que est seleccionada en ese momento (y que
puede cambiarse mediante Preparar pgina). La resolucin mxima es de 1200 PPP. Si el valor de
la impresora es superior, la resolucin del documento PDF ser de 1200 PPP.
Nota: los documentos de alta resolucin pueden generar resultados de baja calidad si se imprimen
en impresoras con menor resolucin.
o por espacios. Para el formato separado por espacios, tambin puede controlar:
Ancho de columna. Autoajuste no muestra nunca el contenido de las columnas en varias lneas.
Cada columna tiene el ancho correspondiente al valor o etiqueta ms ancho que haya en
dicha columna. Personalizado establece un ancho de columna mximo que se aplica a todas
las columnas de la tabla. Los valores que superen dicho ancho se mostrarn en otra lnea en
la misma columna.
Carcter de borde de fila/columna. Controla los caracteres utilizados para crear los bordes de
fila y de columna. Para suprimir la visualizacin de los bordes de fila y columna, especifique
espacios en blanco para estos valores.
Capas en tablas pivote. Por defecto, la inclusin o exclusin de las capas de una tabla pivote est
controlada por las propiedades de la tabla de cada tabla pivote. Puede anular este ajuste e incluir
todas las capas o excluir todas excepto la capa visible en ese momento. Si desea obtener ms
informacin, consulte Propiedades de tabla: Imprimiendo en Captulo 11 el p. 257.
Incluir notas y textos al pie. Controla la inclusin o exclusin de todas las notas y textos al pie de
la tabla pivote.
Vistas de modelos. De manera predeterminada, la inclusin o exclusin de vistas de modelos est
controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas
o excluirlas todas excepto la vista visible en ese momento. Si desea obtener ms informacin,
consulte Propiedades del modelo en Captulo 12 el p. 268. (Nota: todas las vistas de modelos,
incluidas las tablas, se exportan como grficos.)
235
Trabajo con resultados
controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas
o excluirlas todas excepto la vista visible en ese momento. Si desea obtener ms informacin,
consulte Propiedades del modelo en Captulo 12 el p. 268. (Nota: todas las vistas de modelos,
incluidas las tablas, se exportan como grficos.)
236
Captulo 10
Figura 10-10
Opciones slo para grficos
seleccionado.
Comprimir imagen para reducir el tamao de archivo. Tcnica de compresin sin prdida que
237
Trabajo con resultados
Si el nmero de colores del grfico es superior al nmero de colores para dicha profundidad,
los colores se interpolarn para reproducir los colores del grfico.
del ordenador.
Nota: el formato EMF (metarchivo mejorado) slo est disponible en los sistemas operativos
Windows.
(hasta 200%) o especificar un ancho de imagen en pxeles (el alto se determina en funcin del valor
del ancho y la relacin de aspecto). La imagen exportada siempre es proporcional a la original.
Incluir vista preliminar TIFF. Guarda una vista preliminar con la imagen EPS en formato TIFF para
su visualizacin en aplicaciones que no pueden mostrar imgenes EPS en la pantalla.
Fuentes. Controla el tratamiento de fuentes en las imgenes EPS.
Utilizar referencias de fuentes. Si las fuentes que se utilizan en el grfico estn disponibles
Sustituir fuentes con curvas. Convierte las fuentes en datos de curvas PostScript. El texto ya
no se puede editar como texto en las aplicaciones que pueden editar los grficos EPS. Esta
opcin es til si las fuentes que se utilizan en el grfico no estn disponibles en el dispositivo
de los resultados.
de titulares y de contenidos.
238
Captulo 10
E Seleccione los ajustes de impresin que desee.
E Pulse en Aceptar para imprimir.
Presentacin preliminar
Presentacin preliminar muestra lo que se imprimir en cada pgina de los documentos del Visor.
Es una buena idea comprobar la presentacin preliminar antes de imprimir un documento del
Visor, ya que muestra elementos que quiz no puedan verse en el panel de contenidos; entre ellos:
Figura 10-11
Presentacin preliminar
239
Trabajo con resultados
La fecha y la hora
Figura 10-12
Cuadro de dilogo Atributos de pgina: pestaa Encabezado/Pie
Convertir en valor por defecto emplea la configuracin especificada como configuracin por
defecto para los nuevos documentos del Visor. (Nota: Esto hace que la configuracin actual
de las pestaas Encabezado/Pie y Opciones sean la configuracin predeterminada.)
Las etiquetas de las cabeceras de los titulares indican el primer, el segundo, el tercer y/o el
cuarto nivel de cabecera del titular para el primer elemento en cada pgina.
Los ttulos y los subttulos de pgina imprimen los ttulos y subttulos de pgina actuales. Se
pueden crear con la opcin Nuevo ttulo de pgina del men Insertar del Visor o con los
comandos TITLE y SUBTITLE. Si no ha especificado ningn ttulo ni subttulo de pgina,
este ajuste no se tendr en cuenta.
240
Captulo 10
Nota: las caractersticas de las fuentes de los nuevos ttulos y subttulos de pgina se controlan
en la pestaa Visor del cuadro de dilogo Opciones (a la que se accede al seleccionar Opciones
en el men Edicin). Tambin se pueden cambiar las caractersticas de los ttulos y subttulos
de pgina existentes editndolos en el Visor.
Para ver cmo aparecern los encabezados y pies en la pgina impresa, seleccione Presentacin
preliminar en el men Archivo.
Tamao del grfico impreso. Controla el tamao del grfico impreso relativo al tamao de la
Espacio entre los elementos. Controla el espacio entre los elementos impresos. Cada tabla
Numerar las pginas empezando por. Numera las pginas secuencialmente, empezando por el
nmero especificado.
Convertir en valor por defecto. Esta opcin emplea la configuracin especificada como
configuracin por defecto para los nuevos documentos del Visor. (Nota: Esto hace que la
configuracin actual de las pestaas Encabezado/Pie y Opciones sean la configuracin
predeterminada.)
241
Trabajo con resultados
Figura 10-13
Cuadro de dilogo Atributos de pgina, pestaa Opciones
Para cambiar el tamao del grfico impreso, numeracin de pginas y espacio entre elementos
impresos
E Active la ventana del Visor (pulse en cualquier punto de la ventana).
E Elija en los mens:
Archivo
Atributos de pgina...
E Pulse en la pestaa Opciones.
E Cambie los ajustes y pulse en Aceptar.
Almacenamiento de resultados
El contenido del Visor puede guardarse en un documento del Visor. El documento incluir los dos
paneles de la ventana del Visor (titulares y contenidos).
242
Captulo 10
Para guardar los resultados en otros formatos externos (por ejemplo, HTML o texto), utilice el
comando Exportar del men Archivo.
Captulo
11
Tablas pivote
Muchos de los resultados se presentan en tablas que se pueden pivotar de forma interactiva. Es
decir, puede reorganizar las filas, columnas y capas.
o
E Pulse con el botn derecho del ratn en la tabla y seleccione Editar el contenido.
E En el submen, elija En el visor o En la ventana independiente.
Por defecto, al activar la tabla pulsando dos veces en ella, se activan todas las tablas en la
ventana del Visor, excepto las que son muy grandes. Si desea obtener ms informacin,
consulte Tabla pivote: Opciones en Captulo 48 el p. 538.
Si desea tener ms de una tabla pivote activada al mismo tiempo, deber activarlas en
ventanas diferentes.
244
Captulo 11
E Elija en los mens:
Pivotar
Paneles de pivotado
Figura 11-1
Paneles de pivotado
Una tabla tiene tres dimensiones: filas, columnas y capas. Una dimensin puede contener varios
elementos (o ninguno). Puede cambiar la organizacin de la tabla moviendo los elementos entre
las dimensiones o dentro de stas. Para mover un elemento slo tiene que arrastrarlo y colocarlo
en el sitio que desea.
desea mover.
E Arrastre la etiqueta hasta la nueva posicin.
E En el men contextual, seleccione Insertar antes o Intercambiar.
Nota: Asegrese de que Arrastrar para copiar en el men Edicin no no est activado (marcado).
Si est activada, anule su seleccin.
245
Tablas pivote
Esta operacin tiene el mismo efecto que si se arrastraran todos los elementos de fila hasta la
dimensin de las columnas y viceversa.
Se insertar automticamente una etiqueta de grupo. Pulse dos veces en la etiqueta de grupo
para editar el texto de la etiqueta.
Figura 11-2
Etiquetas y grupos de filas y columnas
Nota: para aadir filas o columnas a un grupo existente, debe desagrupar en primer lugar los
elementos que hay actualmente en el grupo. A continuacin, puede crear un nuevo grupo que
incluya los elementos adicionales.
246
Captulo 11
E Elija en los mens:
Formato
Rotar etiquetas de columna interior
o
Formato
Rotar etiquetas de fila exterior
Figura 11-3
Etiquetas de columna rotadas
Slo se pueden rotar las etiquetas de columna ms al interior y las etiquetas de fila ms al exterior.
247
Tablas pivote
Figura 11-4
Desplazamiento de categoras a las capas
Al desplazar elementos a la dimensin de capas se crea una tabla multidimensional, pero slo se
muestra un sector bidimensional. La tabla visible es la tabla de la capa superior. Por ejemplo,
si una variable categrica s/no est en la dimensin de capa, la tabla multidimensional tendr
dos capas: una para la categora s y otra para la categora no.
Figura 11-5
Categoras en capas distintas
panel de pivotado).
248
Captulo 11
Figura 11-6
Seleccin de capas en las listas desplegables
Ir a la categora de capa
Ir a la categora de capa permite cambiar las capas de una tabla pivote. Este cuadro de dilogo es
especialmente til cuando existen muchas capas o la capa seleccionada tiene muchas categoras.
E Elija en los mens:
Pivotar
Ir a capa...
Figura 11-7
Cuadro de dilogo Ir a la categora de capa
E En la lista Categora visible, seleccione una dimensin de capa. La lista Categoras mostrar todas
249
Tablas pivote
Las categoras, incluidas la casilla de la etiqueta y las casillas de datos de una fila o columna
ocultar.
E Elija en el men contextual:
Seleccione
Casillas de datos y etiquetas
E Vuelva a pulsar con el botn derecho del ratn en la etiqueta de categora y seleccione Ocultar
categora en el men contextual.
o
E En el men Ver, seleccione Ocultar.
o
E Para mostrar todas las filas y columnas ocultas de una tabla pivote activada, seleccione en los
mens:
Ver
Mostrar todo
Al hacerlo se mostrarn todas las filas y columnas ocultas de la tabla. Si est seleccionada la
opcin Ocultar filas y columnas vacas en Propiedades de tabla para esta tabla, las filas o columnas
completamente vacas permanecern ocultas.
250
Captulo 11
Aspectos de tabla
Un aspecto de tabla es un conjunto de propiedades que definen el aspecto de una tabla. Puede
seleccionar un aspecto previamente definido o crear uno propio.
Antes o despus de aplicar un aspecto de tabla, se pueden cambiar los formatos de casillas
individuales o de grupos de casillas utilizando las propiedades de casilla. Los formatos de
casilla editados se conservan intactos, aunque se aplique un nuevo aspecto de tabla. Si desea
obtener ms informacin, consulte Propiedades de casilla el p. 258.
Si lo desea, puede restablecer todas las casillas a los formatos de casilla definidos por el
aspecto de tabla actual. De este modo se restablece cualquier casilla que se haya editado. Si
la opcin Como se visualiza est seleccionada en la lista de archivos de aspecto de tabla, las
casillas editadas se restablecern a las propiedades de tabla actuales.
Nota: los aspectos de tabla creados en versiones anteriores de SPSS Statistics no se pueden
utilizar en la versin 16.0 o posterior.
251
Tablas pivote
Figura 11-8
Cuadro de dilogo Aspectos de tabla
252
Captulo 11
Propiedades de tabla
Propiedades de tabla permite establecer las propiedades generales de una tabla definir los estilos
de casilla de varias partes de la tabla y guardar un conjunto de esas propiedades como un aspecto
de tabla. Tiene la posibilidad de:
Controlar las propiedades generales, como ocultar filas o columnas vacas y ajustar las
propiedades de impresin.
Determinar formatos especficos para las casillas en el rea de datos, para las etiquetas de
fila y columna y para otras reas de la tabla.
Controlar la anchura y el color de las lneas que forman los bordes de cada rea de la tabla.
Las nuevas propiedades se aplicarn a la tabla pivote seleccionada. Para aplicar nuevas
propiedades de tabla a un aspecto de tabla en lugar de hacerlo a la tabla seleccionada, edite el
aspecto de tabla (men Formato, Aspectos de tabla).
Mostrar u ocultar filas y columnas vacas. (Una fila o una columna vaca no contiene nada en
ninguna casilla de datos.)
Controlar la colocacin de las etiquetas de fila, que pueden estar anidadas o en la esquina
superior izquierda.
253
Tablas pivote
Figura 11-9
Pestaa General del cuadro de dilogo Propiedades de tabla
El estilo de los marcadores de las notas al pie puede ser nmeros (1, 2, 3...) o letras (a, b, c...).
Los marcadores de las notas al pie se pueden anexar al texto como superndices o como
subndices.
254
Captulo 11
Figura 11-10
Pestaa Notas al pie del cuadro de dilogo Propiedades de tabla
255
Tablas pivote
Figura 11-11
reas de una tabla
Los formatos de casilla se aplican a las reas (categoras de informacin); no son caractersticas
de las casillas individuales. No son caractersticas de casillas individuales. Esta distincin es un
aspecto importante a la hora de pivotar una tabla.
Por ejemplo:
Si especifica una fuente en negrita como formato de casilla de las etiquetas de columna, stas
aparecern en negrita independientemente de la informacin que se muestre actualmente en la
dimensin de columna. Si mueve un elemento de la dimensin de columna a otra dimensin,
no conservar la caracterstica de negrita de las etiquetas de columna.
Si pone en negrita las etiquetas de columna simplemente resaltando las casillas de una tabla
pivote activada y pulsando en el botn Negrita de la barra de herramientas, el contenido de
esas casillas permanecer en negrita independientemente de la dimensin a las que las mueva,
y las etiquetas de columna no conservarn la caracterstica de negrita para otros elementos
movidos a la dimensin de columna.
256
Captulo 11
Figura 11-12
Pestaa Formatos de casilla del cuadro de dilogo Propiedades de tabla
257
Tablas pivote
Figura 11-13
Pestaa Bordes del cuadro de dilogo Propiedades de tabla
Imprimir todas las capas o slo la capa superior de la tabla e imprimir cada capa en una pgina
distinta (esto slo afecta a la impresin, no a la presentacin de las capas en el Visor).
Reducir una tabla horizontal o verticalmente para que se ajuste a la pgina a la hora de
imprimirla.
Controlar las lneas viudas y hurfanas mediante el control del nmero mnimo de filas y
columnas que podr incluir cualquier seccin impresa de una tabla si sta es demasiado ancha
o larga para el tamao de pgina definido.
258
Captulo 11
Nota: Si una tabla es demasiado larga para que quepa en la pgina actual porque hay otros
resultados en la pgina por encima de ella pero cabe en la longitud de pgina definida, la
tabla se imprimir automticamente en una nueva pgina, independientemente del valor de
lneas viudas/hurfanas establecido.
Incluir el texto de continuacin para las tablas que no quepan en una sola pgina. Este texto
puede mostrarse en la parte inferior o superior de cada pgina. Si no selecciona ninguna de
estas opciones, no aparecer el texto de continuacin.
Figura 11-14
Cuadro de dilogo Propiedades de tabla: pestaa Impresin
Propiedades de casilla
Las opciones de Propiedades de casilla slo se aplican a una casilla individual seleccionada.
Puede cambiar la fuente, el formato del valor, la alineacin, los mrgenes y los colores. Las
propiedades de casilla anulan las propiedades de tabla; por tanto, si modifica estas ltimas, no
cambiarn las propiedades de casilla aplicadas individualmente.
Para modificar las propiedades de una casilla:
E Active una tabla y seleccione una o varias de sus casillas.
259
Tablas pivote
E En el men Formato o en el men contextual, seleccione Propiedades de casilla.
Fuente y fondo
La pestaa Fuente y fondo controla el estilo y color de la fuente, y el color de fondo de las casillas
seleccionadas de la tabla.
Figura 11-15
Cuadro de dilogo Propiedades de casilla: pestaa Fuente y fondo
Formato de valor
La pestaa Formato de valor controla los formatos del valor para las casillas seleccionadas. Puede
seleccionar formatos para nmeros, fechas, horas o monedas, as como ajustar el nmero de
dgitos decimales mostrados.
260
Captulo 11
Figura 11-16
Cuadro de dilogo Propiedades de casilla: pestaa Formato de valor
Alineacin y mrgenes
La pestaa Alineacin y mrgenes controla la alineacin horizontal y vertical de los valores y los
mrgenes superior, inferior, izquierdo y derecho para las casillas seleccionadas. La alineacin
horizontal Mixta alinea el contenido de cada celda segn su tipo. Por ejemplo, las fechas se alinean
a la derecha y los valores de texto a la izquierda.
261
Tablas pivote
Figura 11-17
Cuadro de dilogo Propiedades de casilla: pestaa Alineacin y mrgenes
Se puede anexar una nota al pie a cualquier elemento de la tabla. Para aadir una nota al pie:
E Pulse en un ttulo, casilla o texto al pie dentro de una tabla pivote activada.
E En el men Insertar, seleccione Nota al pie.
262
Captulo 11
263
Tablas pivote
264
Captulo 11
Figura 11-20
Cuadrculas mostradas para los bordes ocultos
o
E Pulse con el botn derecho del ratn en la etiqueta de categora de la fila o columna.
E Elija en el men contextual:
Seleccione
Casillas de datos y etiquetas
265
Tablas pivote
E Pulse Ctrl+Alt y, a continuacin, la etiqueta de la fila o columna.
En las tablas pivote multidimensionales (tablas con capas), puede imprimir todas las capas o
slo la capa superior (la visible). Si desea obtener ms informacin, consulte Propiedades
de tabla: Imprimiendo el p. 257.
En las tablas pivote largas o anchas, puede cambiar automticamente el tamao de la tabla para
que quepa en la pgina o controlar la posicin de las rupturas de tabla y de los saltos de pgina.
Si desea obtener ms informacin, consulte Propiedades de tabla: Imprimiendo el p. 257.
Para las tablas que son demasiado anchas o largas para una sola pgina, puede controlar la
ubicacin de las rupturas de tabla entre las pginas.
Utilice Presentacin preliminar, en el men Archivo, para ver cmo aparecern las tablas pivote
en la pgina impresa.
Controlar la posicin de las filas y las columnas por donde se dividen las tablas de gran tamao.
Especificar las filas y las columnas que deben permanecer unidas cuando se dividen las tablas.
Ajustar las tablas de gran tamao para que quepan en el tamao de pgina definido.
Para especificar las rupturas de filas y columnas para las tablas pivote impresas
E Pulse en la etiqueta de la columna situada a la izquierda del lugar donde desee insertar la ruptura,
Para especificar las filas o las columnas que se han de mantener unidas
E Seleccione las etiquetas de las filas o columnas que desee mantener unidas (Pulse y arrastre, o bien
mantenga pulsada la tecla Mays para seleccionar varias etiquetas de fila o columna.)
E Elija en los mens:
Formato
Mantener juntos
266
Captulo 11
Captulo
12
Modelos
Algunos resultados se presentan como modelos, los cuales aparecen en el Visor de resultados como
un tipo especial de visualizacin. La visualizacin que aparece en el Visor de resultados no es la
nica vista disponible del modelo. Un nico modelo contiene muchas vistas diferentes. Puede
activar el modelo en el Visor de modelo e interactuar con el modelo directamente para mostrar las
vistas de modelo disponibles. Tambin puede imprimir y exportar todas las vistas del modelo.
o
E Pulse con el botn derecho del ratn en el modelo y seleccione Editar el contenido en el men
contextual.
E En el submen, seleccione En otra ventana.
Vista principal. La vista principal aparece en la parte izquierda del Visor de modelo. La vista
principal muestra visualizaciones generales del modelo (por ejemplo, un grfico de red). La
propia vista principal puede tener ms de una vista de modelo. La lista desplegable que se
encuentra debajo de la vista principal le permite seleccionar una de las vistas principales
disponibles.
Vista auxiliar. La vista auxiliar aparece en la parte derecha del Visor de modelo. La vista
auxiliar normalmente muestra una visualizacin ms detallada (incluyendo tablas) del modelo
en comparacin con la visualizacin general de la vista principal. Al igual que la vista
principal, la vista auxiliar puede tener ms de una vista de modelo. La lista desplegable que
se encuentra debajo de la vista auxiliar le permite seleccionar una de las vistas auxiliares
disponibles. La vista auxiliar tambin puede mostrar visualizaciones especficas de elementos
seleccionados en la vista principal. Por ejemplo, dependiendo del tipo de modelo, puede
267
268
Captulo 12
seleccionar un nodo de variable en la vista principal para mostrar una tabla para dicha variable
en la vista auxiliar.
Las visualizaciones especficas que se muestran dependen del procedimiento que cre el
modelo. Para obtener ms informacin sobre cmo trabajar con modelos especficos, consulte la
documentacin del procedimiento que cre el modelo.
Tablas del Visor de modelo
Las tablas que aparecen en el Visor de modelo no son tablas pivote. No puede manipular estas
tablas del mismo modo que manipula las tablas pivote.
Edicin y exploracin de vistas de modelo
Dentro del Visor de modelo, puede establecer propiedades especficas para el modelo. Si desea
obtener ms informacin, consulte Propiedades del modelo el p. 268.
Copia de vistas de modelo
Tambin puede copiar vistas de modelo individuales dentro del Visor de modelo. Si desea obtener
ms informacin, consulte Copia de vistas de modelo el p. 269.
Cada modelo tiene propiedades asociadas que le permiten especificar qu vistas se imprimirn
desde el Visor de resultados. De manera predeterminada, slo se imprime la vista que est visible
en el Visor de resultados. sta es siempre una vista principal y slo una vista principal. Tambin
puede especificar que se impriman todas las vistas de modelo disponibles. Esto incluye todas las
vistas principales y auxiliares. Tenga en cuenta que tambin puede imprimir vistas de modelo
individuales dentro del propio Visor de modelo. Si desea obtener ms informacin, consulte
Impresin de un modelo el p. 269.
269
Modelos
Impresin de un modelo
Impresin desde el Visor de modelo
Puede imprimir una nica vista de modelo dentro del propio Visor de modelo.
E Active el modelo en el Visor de modelo. Si desea obtener ms informacin, consulte Interaccin
la que desee imprimir), pulse el icono de impresin. (Si esta paleta no aparece, seleccione
Paletas>General en el men Ver.)
Impresin desde el Visor de resultados
Cuando imprime desde el Visor de resultados, el nmero de vistas que se imprime de un modelo
especfico depende de las propiedades del modelo. Puede configurarse el modelo para que
imprima slo la vista que se muestra o todas las vistas de modelo disponibles. Si desea obtener
ms informacin, consulte Propiedades del modelo el p. 268.
Exportacin de un modelo
De manera predeterminada, cuando exporta modelos desde el Visor de resultados, la inclusin
o exclusin de vistas de modelos est controlada por las propiedades de cada modelo. Si desea
obtener ms informacin acerca de las propiedades de modelo, consulte Propiedades del modelo
el p. 268. En la exportacin, puede anular este ajuste e incluir todas las vistas de modelo o
slo la vista de modelo visible en ese momento. En el cuadro de dilogo Exportar resultados,
pulse Cambiar opciones... en el grupo Documento. Para obtener ms informacin acerca de la
exportacin y este cuadro de dilogo, consulte Exportar resultados el p. 225.Tenga en cuenta que
todas las vistas de modelo, incluidas las tablas, se exportan como grficos.
Captulo
13
Reglas de la sintaxis
Al ejecutar comandos desde una ventana de sintaxis de comandos en el transcurso de una sesin,
lo har en modo interactivo.
Las siguientes reglas se aplican a las especificaciones de los comandos en el modo interactivo:
Cada comando debe comenzar en una lnea nueva. Los comandos pueden comenzar en
cualquier columna de una lnea de comandos y continuar en tantas lneas como se precise.
Existe una excepcin con el comando END DATA, que debe comenzar en la primera columna
de la primera lnea que sigue al final de los datos.
Cada comando debe terminar con un punto como terminador del comando. Sin embargo, es
mejor omitir el terminador en BEGIN DATA, para que los datos interactivos se traten como
una especificacin continua.
270
271
Trabajar con sintaxis de comandos
El terminador del comando debe ser el ltimo carcter de un comando que no est en blanco.
En ausencia de un punto como terminador del comando, las lneas en blanco se interpretan
como un terminador del comando.
Nota: para que exista compatibilidad con otros modos de ejecucin de comandos (incluidos los
archivos de comandos que se ejecutan con los comandos INSERT o INCLUDE en una sesin
interactiva), la sintaxis de lnea de comandos no debe exceder los 256 bytes.
La mayora de los subcomandos estn separados por barras inclinadas (/). La barra inclinada
que precede al primer subcomando de un comando, generalmente es opcional.
El texto incluido entre apstrofos o comillas debe ir contenido en una sola lnea.
Los nombres de variable que terminen en un punto pueden causar errores en los comandos
creados por los cuadros de dilogo. No es posible crear nombres de variable de este tipo en
los cuadros de dilogo y en general deben evitarse.
y
freq var=catlab sexo /percent=25 50 75 /bar.
Para los archivos de comandos ejecutados mediante el comando INCLUDE, se aplican las reglas de
sintaxis del modo por lotes.
Las siguientes reglas se aplican a las especificaciones de los comandos en el modo por lotes:
Todos los comandos del archivo de comandos deben comenzar en la columna 1. Puede utilizar
los signos ms (+) o menos () en la primera columna si desea sangrar la especificacin del
comando para facilitar la lectura del archivo de comandos.
Las lneas no pueden exceder los 256 bytes; los caracteres adicionales quedarn truncados.
272
Captulo 13
A menos que tenga archivos de comandos que ya utilizan el comando INCLUDE, debe utilizar el
comando INSERT en su lugar dado que puede adaptar los archivos de comandos que se ajustan a
los dos conjuntos de reglas. Si genera la sintaxis de comandos pegando las selecciones del cuadro
de dilogo en una ventana de sintaxis, el formato de los comandos es apto para cualquier modo
de operacin. Consulte la referencia de sintaxis de comandos (disponible en formato PDF en el
men Ayuda) si desea obtener ms informacin.
273
Trabajar con sintaxis de comandos
Mientras ejecuta los anlisis, los comandos de las selecciones del cuadro de dilogo se graban
en la anotacin.
E Abra un archivo de sintaxis previamente guardado o cree uno nuevo. Para crear un archivo de
274
Captulo 13
E En el Visor, pulse dos veces en un elemento de anotacin para activarlo.
E Seleccione el texto que desee copiar.
E Seleccione en los mens del Visor:
Edicin
Copiar
E En una ventana de sintaxis, elija en los mens:
Edicin
Pegar
clave y valores de palabras clave de una lista contextual. Puede seleccionar que la lista se
muestre automticamente las sugerencias o que las muestre cuando desee.
subcomandos, palabras clave y valores de palabras clave) tienen una codificacin de colores
por lo que, a simple vista, puede ver trminos sin reconocer. Adems, diferentes errores
sintcticos comunes (como comillas sin cerrar), tienen una codificacin por colores para su
rpida identificacin.
Marcadores. Puede definir marcadores que le permitan navegar rpidamente por archivos de
Paso a paso. Puede pasar por la sintaxis comando por comando, avanzando al siguiente
275
Trabajar con sintaxis de comandos
El panel del editor es la parte principal de la ventana del editor de sintaxis y es donde se
introduce y se edita la sintaxis de comandos.
El canaln se encuentra junto al panel del editor y muestra informacin sobre los nmeros de
lnea y las posiciones de los puntos de separacin.
El panel de navegacin se encuentra a la izquierda del canaln y del panel del editor y muestra
una lista de todos los comandos de la ventana Editor de sintaxis, permitiendo acceder a
cualquier comando con una sola pulsacin.
El panel de error se encuentra bajo el panel del editor y muestra errores de tiempo de ejecucin.
Los nmeros de lnea no tienen en cuenta los archivos externos a los que se hace referencia
en los comandos INSERT e INCLUDE. Puede mostrar u ocultar los nmeros de lnea
seleccionando Ver > Mostrar nmeros de lnea en los mens.
276
Captulo 13
Las amplitudes de comando son iconos que proporcionan indicadores visuales del comienzo y
el final de un comando. Puede mostrar u ocultar las amplitudes de comando seleccionando
Ver > Mostrar amplitudes de comando en los mens.
El progreso de una ejecucin de sintaxis concreta viene indicada por una flecha que seala
hacia abajo en el canaln y que abarca desde la primera ejecucin de comando hasta la ltima.
Esto resulta ms til al ejecutar una sintaxis de comando que contenga puntos de separacin
y al desplazarse por una sintaxis de comando. Si desea obtener ms informacin, consulte
Ejecucin de sintaxis de comandos el p. 281.
Panel de navegacin
El panel de navegacin contiene una lista de todos los comandos reconocidos en la ventana de
sintaxis, indicados en el orden en el que tienen lugar en la ventana. Si pulsa un comando del panel
de navegacin, colocar el cursor al inicio del comando.
Puede utilizar las teclas de flecha Arriba y Abajo para pasar por la lista de comandos o pulsar
en un comando para navegar hasta l. Pulse dos veces para seleccionar el comando.
Los nombres de comando de comandos que contengan ciertos tipos de errores sintcticos,
como comillas sin cerrar, aparecen de forma predeterminada en color rojo y negrita. Si desea
obtener ms informacin, consulte Codificacin de colores el p. 277.
Puede mostrar u ocultar el panel de navegacin seleccionando Ver > Mostrar panel de
navegacin en los mens.
Panel de error
La informacin sobre cada error contiene el nmero de lnea en el que se produjo el error.
Puede utilizar las teclas de flecha hacia arriba y hacia abajo para desplazarse por la lista
de errores.
Pulse en una entrada de la lista para colocar el cursor en la lnea que gener el error.
Puede mostrar u ocultar el panel de errores seleccionando Ver > Mostrar panel de error en
los mens.
Terminologa
Comandos. La unidad bsica de sintaxis es el comando. Cada comando comienza por el nombre
del comando, que consiste en una, dos o tres palabras, por ejemplo, DESCRIPTIVES, SORT
CASES o ADD VALUE LABELS.
Subcomandos. La mayora de los comandos contienen subcomandos. Los subcomandos ofrecen
especificaciones adicionales y comienzan por una barra diagonal seguida del nombre del
subcomando.
Palabras clave. Las palabras clave son trminos fijos que suelen utilizarse con un subcomando
277
Trabajar con sintaxis de comandos
Valores de palabra clave. Las palabras clave pueden tener valores como un trmino fijo que
Autocompletar
El editor de sintaxis ofrece asistencia en forma de autocompletar comandos, subcomandos,
palabras clave y valores de palabras clave. De manera predeterminada, se le mostrar una lista
contextual de los trminos disponibles. Puede mostrar la lista cuando desee pulsando Ctrl y la
barra espaciadora, y puede cerrar la lista pulsando la tecla Esc.
El elemento de men Auto-completar del men Herramientas activa o desactiva la visualizacin
automtica de la lista autocompletar. Tambin puede activar o desactivar la visualizacin
automtica de la lista desde la pestaa Editor de sintaxis del cuadro de dilogo Opciones. Al
modificar el elemento de men Autocompletar se sobrescribe el ajuste del cuadro de dilogo
Opciones, aunque esto no se conserva en diferentes sesiones.
Nota: La lista autocompletar se cerrar si se introduce un espacio. En el caso de comandos que
se compongan de varias palabras como ADD FILES, seleccione el comando deseado antes de
introducir espacios.
Codificacin de colores
El editor de sintaxis codifica con colores los elementos reconocidos de la sintaxis de comando,
como los comandos y subcomandos, as como varios errores sintcticos como comillas o
parntesis sin cerrar. El texto no reconocido no se codifica con colores.
Comandos. De forma predeterminada, los comandos reconocidos tienen el color azul y aparecen
en negrita. Sin embargo, si hay un error sintctico reconocido en el comando (como parntesis sin
cerrar), el nombre del comando aparecer en rojo y en negrita de forma predeterminada.
Nota: Las abreviaturas de los nombres de comando, como FREQ para FREQUENCIES no estn
coloreadas, pero estas abreviaturas son vlidas.
Subcomandos. Los subcomandos reconocidos aparecen en verde de forma predeterminada. Sin
embargo, si en el subcomando falta un signo igual obligatorio o viene seguido de un signo igual
no vlido, el nombre del subcomando aparecer de forma predeterminada en rojo.
278
Captulo 13
Palabras clave. Los subcomandos reconocidos aparecen en granate de forma predeterminada. Sin
embargo, si en el subcomando falta un signo igual obligatorio o viene seguido de un signo igual
no vlido, el nombre del subcomando aparecer de forma predeterminada en rojo.
Valores de palabra clave. Los valores de palabra clave reconocidos aparecen en rosa de forma
predeterminada. Los valores de palabra clave que especifique el usuario, como los nmeros
enteros, los nmeros reales y las cadenas entrecomilladas, no aparecern con codificacin de color.
Comentarios. El texto de los comentarios aparece en gris.
Errores sintcticos. El texto asociado con los siguientes errores sintcticos aparece de forma
predeterminada en rojo.
Parntesis, corchetes y comillas sin cerrar. Los parntesis y corchetes sin cerrar que aparecen
Lneas largas. Las lneas largas son lneas que contienen ms de 251 caracteres.
Instrucciones End. Varios comandos requieren una instruccin END antes del terminador del
comando (por ejemplo, BEGIN DATA-END DATA) o requieren un comando END coincidente
en un punto posterior de la secuencia de comandos (por ejemplo, LOOP-END LOOP ). En
ambos casos, el comando aparecer en rojo por defecto hasta que se aada la instruccin
END necesaria.
En la pestaa Editor de sintaxis del cuadro de dilogo Opciones, puede cambiar los colores y
estilos de texto predeterminados y activar o desactivar la codificacin de colores. Tambin puede
activar o desactivar la codificacin de colores de comandos, subcomandos, palabras clave y
valores de palabras clave seleccionando Herramientas > Codificacin de colores en los mens.
Puede activar o desactivar la codificacin de colores de los errores sintcticas seleccionando
Herramientas > Validacin. Las modificaciones que aplique al men Herramientas sobrescribirn
las opciones del cuadro de dilogo Opciones, aunque esto no se conserva en diferentes sesiones.
Nota: La codificacin de colores de la sintaxis de comandos en macros no es compatible.
Puntos de separacin
Los puntos de separacin le permiten detener la ejecucin de la sintaxis de comando en puntos
especficos de la ventana de sintaxis y continuar con la ejecucin cuando est listo.
Los puntos de separacin no pueden producirse en los bloques LOOP-END LOOP, DO IF-END
IF, DO REPEAT-END REPEAT, INPUT PROGRAM-END INPUT PROGRAM y MATRIX-END
MATRIX. Sin embargo, pueden definirse al principios de estos bloques y detendrn la
ejecucin antes de ejecutar el bloque.
279
Trabajar con sintaxis de comandos
No es posible definir los puntos de separacin en lneas que contengan sintaxis de comando
que no sean de SPSS Statistics, como ocurre con los bloques BEGIN PROGRAM-END
PROGRAM, BEGIN DATA-END DATA y BEGIN GPL-END GPL.
o
E Coloque el cursor dentro del comando que desee.
E Elija en los mens:
Herramientas
Conmutar punto de separacin
280
Captulo 13
Marcadores
Los marcadores le permiten desplazarse rpidamente a posiciones especficas de un archivo de
sintaxis de comandos. En cada archivo es posible tener hasta 9 marcadores. Los marcadores se
guardan con el archivo, pero no se incluyen al copiar texto.
Para insertar un marcador
E Site el cursor en la lnea donde desea insertar el marcador.
E Elija en los mens:
Herramientas
Conmutar marcador
281
Trabajar con sintaxis de comandos
o
Herramientas
Marcador anterior
Comentario de texto
Puede comentar comandos completos, as como texto no reconocido como una sintaxis de
comando.
E Seleccione el texto que desee. Si selecciona mltiples comandos, se comentar un comando si
Puede comentario un nico comando colocando el cursor en cualquier punto del comando y
pulsando en el botn Comentar seleccin de la barra de herramientas.
del Editor de sintaxis. Ejecuta los comandos seleccionados o el comando en el que se encuentra
el cursor si no se ha seleccionado ninguno.
o
E Seleccione una de las opciones del men Ejecutar.
Todo. Ejecuta todos los comandos de la ventana de sintaxis, respetando los puntos de
separacin.
282
Captulo 13
Hasta el final. Ejecuta todos los comandos empezando por el primer comando de la seleccin
actual hasta el ltimo comando de la ventana de sintaxis, respetando todos los puntos de
separacin. Si no se ha seleccionado ninguno, la ejecucin comienza desde el comando
donde se encuentra el cursor.
Paso a paso. Ejecuta la sintaxis de comando con los comandos de uno en uno empezando por
el primer comando de la ventana de sintaxis (Paso a paso desde inicio) o desde el comando en
que se encuentra posicionado el cursor (Paso a paso desde actual). Si hay texto seleccionado,
la ejecucin se inicia a partir del primer comando de la seleccin. Una vez que se ha ejecutado
un comando concreto, el cursor avanza al siguiente comando y contina la secuencia paso
a paso seleccionando Continuar.
Los bloques LOOP-END LOOP, DO IF-END IF, DO REPEAT-END REPEAT, INPUT
PROGRAM-END INPUT PROGRAM y MATRIX-END MATRIX se tratan como comandos nicos
cuando se utiliza Paso a paso. No es posible entrar en uno de estos bloques.
Continuar. Contina una ejecucin detenida por un punto de separacin o un Paso a paso.
Indicador de progreso
El progreso de una ejecucin de sintaxis concreta viene indicada por una flecha que seala
hacia abajo en el canaln y que abarca desde la ltima ejecucin de conjunto de comandos. Por
ejemplo, opta por ejecutar todos los comandos de una ventana de sintaxis que contiene puntos
de separacin. En el primer punto de separacin, la flecha abarcar la regin desde el primer
comando de la ventana al comando anterior que contiene el punto de separacin. En el segundo
punto de separacin, la flecha abarcar el comando que contenga el primer punto de separacin
del comando antes del segundo punto de separacin.
Procesamiento del tiempo de ejecucin con puntos de separacin
Cuando ejecute una sintaxis de comando que contenga puntos de separacin, la ejecucin se
detendr en cada punto de separacin. Concretamente, el bloque de sintaxis de comandos que
va desde un punto de separacin concreto (o del principio de la ejecucin) hasta el siguiente
(o hasta el fin de la ejecucin) se enva para su ejecucin exactamente de la misma forma que
si hubiera seleccionado esa sintaxis y elegido Ejecutar > Seleccin.
Puede trabajar con mltiples ventanas de sintaxis, cada una con su propio conjunto de puntos
de separacin, pero slo hay una cola para ejecutar la sintaxis de comandos. Una vez que se
ha enviado un bloque de sintaxis de comandos, como el bloque de sintaxis de comandos hasta
el primer punto de separacin, no se ejecutar ningn otro bloque de sintaxis de comandos
hasta que se haya completado el bloque anterior, independientemente de si los bloques se
encuentran en la misma ventana de sintaxis o en ventanas diferentes.
Con la ejecucin detenida en un punto de separacin, puede ejecutar una sintaxis de comando
en otras ventanas de sintaxis y examinar las ventanas Editor de datos o la ventana del Visor.
Sin embargo, si modifica el contenido de la ventana de sintaxis que contiene el punto de
separacin o cambia la posicin del cursor en esa ventana se cancelar la ejecucin.
283
Trabajar con sintaxis de comandos
Una excepcin importante son los comandos de transformacin que contienen funciones de
retardo. En una serie de comandos de transformacin sin intervencin de comandos EXECUTE, ni
ningn otro comando que lea datos, las funciones de retardo se calculan despus de las restantes
transformaciones, con independencia del orden de los comandos. Por ejemplo:
COMPUTE lagvar=LAG(var1).
COMPUTE var1=var1*2.
y
COMPUTE lagvar=LAG(var1).
EXECUTE.
COMPUTE var1=var1*2.
ofrece resultados muy diferentes para el valor de lagvar dado que el anterior utiliza el valor
transformado de var1 mientras que el ltimo utiliza el valor original.
Captulo
14
Libro de cdigos
El libro de cdigos hace referencia a la informacin del diccionario, como nombres de variable,
etiquetas de variables, etiquetas de valores o valores ausentes, y las estadsticas de resumen de
todas o las variables especificadas y conjuntos de respuestas mltiples del conjunto de datos
activo. Para variables nominales y ordinales y conjuntos de respuestas mltiples, las estadsticas
de resumen incluyen recuentos y porcentajes. Para variables de escala, las estadsticas de resumen
incluyen la media, desviacin estndar y cuartiles.
Nota: El libro de cdigos ignora el estado del archivo segmentado. Esto incluye los grupos de
archivos segmentados para imputaciones mltiples de valores perdidos (disponible en la opcin
adicional Valores perdidos). Si desea obtener ms informacin sobre el procesamiento de archivos
segmentados, consulte Segmentar archivo.
Para obtener un libro de cdigos
E Elija en los mens:
Analizar
Informes
Libro de cdigos
E Pulse en la pestaa Variables.
284
285
Libro de cdigos
Figura 14-1
Cuadro de dilogo libro de cdigos, pestaa Variables
Si lo desea, puede:
Controlar las estadsticas que aparecen (o excluir todas las estadsticas de resumen).
Controlar el orden en que aparecen las variables y los conjuntos de respuestas mltiples.
Cambiar el nivel de medicin de cualquier variable en la lista de origen para modificar las
estadsticas de resumen que aparecen. Si desea obtener ms informacin, consulte Pestaa
Estadsticas del libro de cdigos el p. 289.
Puede cambiar temporalmente el nivel de medicin de variables. (No puede modificar el nivel de
medicin de conjuntos de respuestas mltiples. Se tratarn siempre como nominales.)
E En la lista de origen, pulse con el botn derecho del ratn en una variable.
E Seleccione un nivel de medida del men contextual emergente.
Se modificar el nivel de medicin temporalmente. En trminos prcticos, esto slo es til para
variables numricas. El nivel de medida de las variables de cadena est restringido a nominal u
ordinal, los cuales reciben el mismo tratamiento por parte del procedimiento del libro de cdigos.
286
Captulo 14
mltiple.
Formato. El formato de visualizacin de la variable, como A4, F8.2 o DATE11. No est disponible
287
Libro de cdigos
Para los conjuntos de dicotomas mltiples, las etiquetas de valor son etiquetas de variable
de las variables elementales en el conjunto o las etiquetas de valores contados, dependiendo
de cmo se define el conjunto. Si desea obtener ms informacin, consulte Conjuntos de
respuestas mltiples en Captulo 7 el p. 113.
Valores perdidos. Valores perdidos definidos por el usuario. Si desea obtener ms informacin,
resultados incluyen los nombres y valores de cualquier atributo de variable personalizado asociado
con cada variable. Si desea obtener ms informacin, consulte Creacin de atributos de variable
personalizados en Captulo 5 el p. 87. No est disponible para conjuntos de respuestas mltiples.
Atributos reservados. Atributos de variable de sistema reservados. Puede mostrar atributos del
sistema, pero no debe modificarlas. Los nombres de atributos del sistema comienzan por un signo
de dlar ($). No se incluyen los atributos que no se muestran, cuyo nombre comienza por @ o
$@. Los resultados incluyen los nombres y valores de cualquier atributo de sistema asociado
con cada variable. No est disponible para conjuntos de respuestas mltiples.
Informacin sobre el archivo
La tabla de informacin del archivo opcional puede incluir cualquiera de los atributos de archivos
siguientes:
Nombre de archivo. Nombre del archivo de datos de SPSS Statistics. Si el conjunto de datos no se
ha guardado nunca en formato de SPSS Statistics, no existe un nombre de archivo de datos. (Si no
aparece un nombre de archivo en la barra de ttulo de la ventana del Editor de datos, el conjunto de
datos activo no tiene un nombre de archivo.)
Posicin. Ubicacin del directorio (carpeta) del archivo de datos de SPSS Statistics. Si el conjunto
de datos no se ha guardado nunca en formato de SPSS Statistics, no existe una ubicacin.
Nmero de casos. Nmero de casos en el conjunto de datos activo. Es el nmero total de casos,
incluyendo los casos que se pueden excluir de las estadsticas de resumen por condiciones de filtro.
288
Captulo 14
Etiqueta. Es la etiqueta del archivo (si tiene alguna) que define el comando FILE LABEL.
Documentos. Texto del documento del archivo de datos. Si desea obtener ms informacin,
Las siguientes alternativas estn disponibles para controlar el orden en que aparecen las variables
y los conjuntos de respuestas mltiples.
Alfabtico. Orden alfabtico por nombre de variable.
Archivo. El orden en que aparecen las variables en el conjunto de datos (el orden en que aparecen
en el editor de datos). En orden ascendente, los conjuntos de respuestas mltiples aparecen en
ltimo lugar, despus de todas las variables seleccionadas.
Nivel de medida. Ordenar por nivel de medida. Se crean cuatro grupos de clasificacin: nominal,
los nombres de cualquier atributo de variables personalizadas definidas por el usuario. En orden
ascendente, las variables que no tienen la opcin de clasificacin de atributos al principio, seguidas
de las variables que tienen el atributo pero no los valores definidos del atributo, seguidas de las
variables con valores definidos para el atributo en orden alfabtico de los valores.
Nmero mximo de categoras
Si el resultado incluye etiquetas de valor, los recuentos o porcentajes de cada valor nico, puede
eliminar esta informacin de la tabla si el nmero de los valores excede el valor especificado. Por
defecto, esta informacin se elimina si el nmero de valores nicos de la variable es superior a 200.
289
Libro de cdigos
Recuentos y porcentajes
Para las variables nominales y ordinales, conjuntos de respuestas mltiples y valores de etiquetas
o variables de escala, las estadsticas disponibles son:
Recuento. Contador o nmero de casos que tienen cada valor (o el rango de valores) de una
variable.
Porcentaje. Porcentaje de casos que presenta un valor determinado.
Tendencia central y dispersin
290
Captulo 14
Desviacin tpica. Es una medida de la dispersin en torno a la media. En una distribucin normal,
el 68% de los casos se encuentra dentro de una desviacin tpica de la media y el 95% queda entre
dos desviaciones tpicas. Por ejemplo, si la edad media es de 45 aos, con una desviacin tpica de
10, el 95% de los casos estara entre los 25 y 65 en una distribucin normal.
Cuartiles. Muestra los valores correspondientes a los percentiles 25, 50 y 75.
Nota: Puede modificar de forma temporal el nivel de medicin asociado con una variable (y por lo
tanto, modificar las estadsticas de resumen de la variable) en la lista de variables de origen de
la pestaa Variables.
Captulo
15
Frecuencias
resultados podra observar que el 37,5% de sus clientes pertenece a agencias gubernamentales, el
24,9% a corporaciones, el 28,1% a instituciones acadmicas, y el 9,4% a la industria sanitaria. Con
respecto a los datos continuos, cuantitativos, como los ingresos por ventas, podra comprobar que
el promedio de ventas de productos es de 3.576 dlares con una desviacin tpica de 1.078 dlares.
Estadsticos y grficos. Frecuencias, porcentajes, porcentajes acumulados, media, mediana, moda,
suma, desviacin tpica, varianza, amplitud, valores mnimo y mximo, error tpico de la media,
asimetra y curtosis (ambos con sus errores tpicos), cuartiles, percentiles especificados por el
usuario, grficos de barras, grficos de sectores e histogramas.
Datos. Utilice cdigos numricos o cadenas para codificar las variables categricas (medidas
de nivel nominal u ordinal).
Supuestos. Las tabulaciones y los porcentajes proporcionan una descripcin til para los datos de
cualquier distribucin, especialmente para las variables con categoras ordenadas o desordenadas.
Muchos de los estadsticos de resumen optativos, tales como la media y la desviacin tpica, se
basan en la teora normal y son apropiados para las variables cuantitativas con distribuciones
simtricas. Los estadsticos robustos, tales como la mediana, los cuartiles y los percentiles son
apropiados para las variables cuantitativas que pueden o no cumplir el supuesto de normalidad.
Para obtener tablas de frecuencias
E En los mens, seleccione:
Analizar
Estadsticos descriptivos
Frecuencias...
291
292
Captulo 15
Figura 15-1
Cuadro de dilogo principal Frecuencias
Si lo desea, puede:
Pulsar en Estadsticos para obtener estadsticos descriptivos para las variables cuantitativas.
Frecuencias: Estadsticos
Figura 15-2
Cuadro de dilogo Frecuencias: Estadsticos
293
Frecuencias
Valores percentiles. Los valores de una variable cuantitativa que dividen los datos ordenados
en grupos, de forma que un porcentaje de los casos se encuentre por encima y otro porcentaje
se encuentre por debajo. Los cuartiles (los percentiles 25, 50 y 75) dividen las observaciones en
cuatro grupos de igual tamao. Si desea un nmero igual de grupos que no sea cuatro, seleccione
Puntos de corte para n grupos iguales. Tambin puede especificar percentiles individuales (por
ejemplo, el percentil 95, el valor por debajo del cual se encuentran el 95% de las observaciones).
Tendencia central. Los estadsticos que describen la localizacin de la distribucin, incluyen:
Media, Mediana, Moda y Suma de todos los valores.
Media. Una medida de tendencia central. El promedio aritmtico, la suma dividida por
el nmero de casos.
Mediana. Es el valor por encima y por debajo del cual se encuentran la mitad de los casos,
el percentil 50. Si hay un nmero par de casos, la mediana es la media de los dos valores
centrales, cuando los casos se ordenan en orden ascendente o descendente. La mediana es una
medida de tendencia central que no es sensible a los valores atpicos (a diferencia de la media,
que puede resultar afectada por unos pocos valores extremadamente altos o bajos).
Moda. El valor que ocurre con mayor frecuencia. Si varios valores comparten la mayor
Suma. Suma o total de todos los valores, a lo largo de todos los casos que no tengan valores
perdidos.
Dispersin. Los estadsticos que miden la cantidad de variacin o de dispersin en los datos,
incluyen: Desviacin tpica, Varianza, Rango, Mnimo, Mximo y Error tpico de la media.
normal, el 68% de los casos se encuentra dentro de una desviacin tpica de la media y el
95% queda entre dos desviaciones tpicas. Por ejemplo, si la edad media es de 45 aos, con
una desviacin tpica de 10, el 95% de los casos estara entre los 25 y 65 en una distribucin
normal.
Varianza. Es una medida de dispersin en torno a la media, igual a la suma de las desviaciones
Rango. Diferencia entre los valores mayor y menor de una variable numrica; el mximo
menos el mnimo.
E. T. media. Es una medida de cunto puede variar el valor de la media entre varias muestras
294
Captulo 15
y tiene un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva
significativa tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa
significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetra
mayor que el doble de su error tpico se asume que indica una desviacin de la simetra.
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto central.
Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva
indica que las observaciones se concentran ms y presentan colas ms largas que las de una
distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y
presentan colas ms cortas.
Los valores son puntos medios de grupos. Si los valores de los datos son puntos medios de grupos
(por ejemplo, si las edades de todas las personas entre treinta y cuarenta aos se codifican como
35), seleccione esta opcin para estimar la mediana y los percentiles para los datos originales no
agrupados.
Frecuencias: Grficos
Figura 15-3
Cuadro de dilogo Frecuencias: Grficos
Tipo de grfico. Los grficos de sectores muestran la contribucin de las partes a un todo. Cada
sector de un grfico de este tipo corresponde a un grupo, definido por una nica variable de
agrupacin. Los grficos de barras muestran la frecuencia de cada valor o categora distinta
como una barra diferente, permitiendo comparar las categoras de forma visual. Los histogramas
tambin cuentan con barras, pero se representan a lo largo de una escala de intervalos iguales. La
altura de cada barra es el recuento de los valores que estn dentro del intervalo para una variable
cuantitativa. Los histogramas muestran la forma, el centro y la dispersin de la distribucin.
Una curva normal superpuesta en un histograma ayuda a juzgar si los datos estn normalmente
distribuidos.
Valores del grfico. Para los grficos de barras, puede etiquetar el eje de escala con las frecuencias
o los porcentajes.
295
Frecuencias
Frecuencias: Formato
Figura 15-4
Cuadro de dilogo Frecuencias: Formato
Ordenar por. La tabla de frecuencias se puede organizar respecto a los valores actuales de los datos
o respecto al recuento (frecuencia de aparicin) de esos valores y la tabla puede organizarse en
orden ascendente o descendente. Sin embargo, si solicita un histograma o percentiles, Frecuencias
asumir que la variable es cuantitativa y mostrar sus valores en orden ascendente.
Mltiples variables. Si desea generar tablas de estadsticos para mltiples variables, podr mostrar
todas las variables en una sola tabla (Comparar variables), o bien mostrar una tabla de estadsticos
independiente para cada variable (Organizar resultados segn variables).
Suprimir tablas con ms de n categoras. Esta opcin impide que se muestren tablas que contengan
ms valores que el nmero especificado.
Captulo
16
Descriptivos
suma, error tpico de la media, curtosis y asimetra con sus errores tpicos.
Datos. Utilice variables numricas despus de haberlas inspeccionado grficamente para registrar
en la teora normal y son adecuados para variables cuantitativas (medidas a nivel de razn o de
intervalo) con distribuciones simtricas. Se deben evitar las variables con categoras no ordenadas
o distribuciones asimtricas. La distribucin de puntuaciones z tiene la misma forma que la de
los datos originales; por tanto, el clculo de puntuaciones z no es una solucin para los datos
con problemas.
Para obtener estadsticos descriptivos
E En los mens, seleccione:
Analizar
Estadsticos descriptivos
Descriptivos...
296
297
Descriptivos
Figura 16-1
Cuadro de dilogo Descriptivos
Si lo desea, puede:
Seleccionar Guardar valores tipificados como variables para guardar las puntuaciones z como
nuevas variables.
Descriptivos: Opciones
Figura 16-2
Cuadro de dilogo Descriptivos: Opciones
298
Captulo 16
Dispersin. Los estadsticos que miden la dispersin o variacin en los datos incluyen la
normal, el 68% de los casos se encuentra dentro de una desviacin tpica de la media y el
95% queda entre dos desviaciones tpicas. Por ejemplo, si la edad media es de 45 aos, con
una desviacin tpica de 10, el 95% de los casos estara entre los 25 y 65 en una distribucin
normal.
Varianza. Es una medida de dispersin en torno a la media, igual a la suma de las desviaciones
Rango. Diferencia entre los valores mayor y menor de una variable numrica; el mximo
menos el mnimo.
E. T. media. Es una medida de cunto puede variar el valor de la media entre varias muestras
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto central.
Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva
indica que las observaciones se concentran ms y presentan colas ms largas que las de una
distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y
presentan colas ms cortas.
y tiene un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva
significativa tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa
significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetra
mayor que el doble de su error tpico se asume que indica una desviacin de la simetra.
Orden de presentacin. Por defecto, las variables se muestran en el orden en que se hayan
seleccionado. Si lo desea, se pueden mostrar las variables alfabticamente, por medias ascendentes
o por medias descendentes.
Guardar puntuaciones tipificadas (puntuaciones z) para algunas variables, pero no para todas
(con el subcomando VARIABLES).
Especificar nombres para las variables nuevas que contienen puntuaciones tipificadas
(mediante el subcomando VARIABLES).
299
Descriptivos
Excluir del anlisis casos con valores perdidos para cualquier variable (mediante el
subcomando MISSING).
Ordenar las variables de la presentacin por el valor de cualquier estadstico, no slo por
la media (mediante el subcomando SORT).
Captulo
17
Explorar
sometidas a cuatro programas de refuerzo diferentes. Para cada uno de los cuatro grupos, se puede
observar si la distribucin de tiempos es aproximadamente normal y si las cuatro varianzas son
iguales. Tambin se pueden identificar los casos con los cinco valores de tiempo mayores y los
cinco menores. Los diagramas de caja y los grficos de tallo y hojas resumen grficamente la
distribucin del tiempo de aprendizaje de cada uno de los grupos.
Estadsticos y grficos. Media, mediana, media recortada al 5%, error tpico, varianza, desviacin
tpica, mnimo, mximo, amplitud, amplitud intercuartil, asimetra y curtosis y sus errores
tpicos, intervalo de confianza para la media (y el nivel de confianza especificado), percentiles,
estimador-M de Huber, estimador en onda de Andrews, estimador-M redescendente de Hampel,
estimador biponderado de Tukey, cinco valores mayores y cinco menores, estadstico de
Kolmogorov-Smirnov con el nivel de significacin de Lilliefors para contrastar la normalidad y
estadstico de Shapiro-Wilk. Diagramas de caja, grficos de tallo y hojas, histogramas, diagramas
de normalidad y diagramas de dispersin por nivel con pruebas de Levene y transformaciones.
Datos. El procedimiento Explorar se puede utilizar para las variables cuantitativas (nivel de
medida de razn o de intervalo). Una variable de factor (utilizada para dividir los datos en
grupos de casos) debe tener un nmero razonable de valores distintivos (categoras). Estos
valores pueden ser de cadena corta o numricos. La variable de etiquetas de caso, utilizada para
etiquetar valores atpicos en los diagramas de caja, puede ser de cadena corta, de cadena larga
(los 15 primeros bytes) o numrica.
Supuestos. La distribucin de los datos no tiene que ser simtrica ni normal.
300
301
Explorar
Si lo desea, puede:
Pulse en Estadsticos para obtener estimadores robustos, valores atpicos, percentiles y tablas
de frecuencias.
Explorar: Estadsticos
Figura 17-2
Cuadro de dilogo Explorar: Estadsticos
302
Captulo 17
Descriptivos. Por defecto se muestran estas medidas de dispersin y de tendencia central. stas
Explorar: Grficos
Figura 17-3
Cuadro de dilogo Explorar: Grficos
Diagramas de caja. Estas alternativas controlan la presentacin de los diagramas de caja cuando
existe ms de una variable dependiente. Niveles de los factores juntos genera una presentacin para
cada variable dependiente. En cada una se muestran diagramas de caja para cada uno de los
grupos definidos por una variable de factor. Dependientes juntas genera una presentacin para
cada grupo definido por una variable de factor. En cada una se muestran juntos los diagramas de
caja de cada variable dependiente. Esta disposicin es particularmente til cuando las variables
representan una misma caracterstica medida en momentos distintos.
Descriptivos. La seccin Descriptivos permite seleccionar grficos de tallo y hojas e histogramas.
Grficos con pruebas de normalidad. Muestra los diagramas de probabilidad normal y de
303
Explorar
diagramas de dispersin por nivel. Para todos los diagramas de dispersin por nivel se muestra
la pendiente de la lnea de regresin y las pruebas robustas de Levene sobre la homogeneidad
de varianza. Si selecciona una transformacin, las pruebas de Levene se basarn en los datos
transformados. Si no selecciona ninguna variable de factor, no se generar ningn diagrama de
dispersin por nivel. Estimacin de potencia produce un grfico de los logaritmos naturales de las
amplitudes intercuartiles respecto a los logaritmos naturales de las medianas de todas las casillas,
as como una estimacin de la transformacin de potencia necesaria para conseguir varianzas
iguales en las casillas. Un diagrama de dispersin por nivel ayuda a determinar la potencia que
precisa una transformacin para estabilizar (igualar) las varianzas de los grupos. Transformados
permite seleccionar una de las alternativas de potencia, quizs siguiendo las recomendaciones de
la estimacin de potencia, y genera grficos de los datos transformados. Se trazan la amplitud
intercuartil y la mediana de los datos transformados. No transformados genera grficos de los datos
brutos. Es equivalente a una transformacin con una potencia de 1.
1/raz cuadrada. Para cada valor de los datos se calcula el inverso de la raz cuadrada.
Explorar: Opciones
Figura 17-4
Cuadro de dilogo Explorar: Opciones
304
Captulo 17
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable de factor o
variable dependiente se excluyen de todos los anlisis. Este es el mtodo por defecto.
Excluir casos segn pareja. Los casos que no tengan valores perdidos para las variables de un
grupo (casilla) se incluyen en el anlisis de ese grupo. El caso puede tener valores perdidos
para las variables utilizadas en otros grupos.
Mostrar los valores. Los valores perdidos para las variables de factor se tratan como una
categora diferente. Todos los resultados se generan para esta categora adicional. Las tablas
de frecuencias incluyen categoras para los valores perdidos. Los valores perdidos para una
variable de factor se incluyen pero se etiquetan como perdidos.
Solicitar los grficos y resultados totales adems de los grficos y los resultados para los
grupos definidos por las variables de factor (con el subcomando TOTAL).
Especificar una escala comn para un grupo de diagramas de caja (con el subcomando SCALE).
Especificar una transformacin de potencia para diagramas de dispersin por nivel (con el
subcomando PLOT).
Especificar parmetros para los estimadores robustos centrales, los estimadores robustos de
ubicacin (mediante el subcomando MESTIMATORS).
Captulo
Tablas de contingencia
18
cadena (ocho bytes o menos). Por ejemplo, para sexo, podra codificar los datos como 1 y 2 o
como varn y mujer.
Supuestos. En algunos estadsticos y medidas se asume que hay unas categoras ordenadas (datos
305
306
Captulo 18
Nota: Las variables ordinales pueden ser cdigos numricos que representen categoras (por
ejemplo, 1 = bajo, 2 = medio, 3 = alto) o valores de cadena. Sin embargo, se supone que el orden
alfabtico de los valores de cadena indica el orden correcto de las categoras. Por ejemplo, en una
variable de cadena cuyos valores sean bajo, medio, alto, se interpreta el orden de las categoras
como alto, bajo, medio (orden que no es el correcto). Por norma general, se puede indicar que es
ms fiable utilizar cdigos numricos para representar datos ordinales.
Para obtener tablas de contingencia
E En los mens, seleccione:
Analizar
Estadsticos descriptivos
Tablas de contingencia...
Figura 18-1
Cuadro de dilogo Tablas de contingencia
Si lo desea, puede:
Pulsar en Estadsticos para obtener pruebas y medidas de asociacin para tablas o subtablas de
doble clasificacin.
307
Tablas de contingencia
datos por grupos de casos. Hay una agrupacin de barras por cada valor de la variable especificada
en el cuadro Filas. La variable que define las barras dentro de cada agrupacin es la variable
especificada en el cuadro Columnas. Por cada valor de esta variable hay un conjunto de barras de
distinto color o trama. Si especifica ms de una variable en Columnas o en Filas, se generar un
grfico de barras agrupadas por cada combinacin de dos variables.
Chi-cuadrado. Para las tablas con dos filas y dos columnas, seleccione Chi-cuadrado para calcular
el chi-cuadrado de Pearson, el chi-cuadrado de la razn de verosimilitud, la prueba exacta de
Fisher y el chi-cuadrado corregido de Yates (correccin por continuidad). Para las tablas 2 2, se
calcula la prueba exacta de Fisher cuando una tabla (que no resulte de perder columnas o filas
en una tabla mayor) presente una casilla con una frecuencia esperada menor que 5. Para las
restantes tablas 2 2 se calcula el chi-cuadrado corregido de Yates. Para las tablas con cualquier
308
Captulo 18
entre 0 y 1. El valor 0 indica que no hay asociacin entre las variables de fila y de columna.
Los valores cercanos a 1 indican que hay gran relacin entre las variables. El valor mximo
posible depende del nmero de filas y columnas de la tabla.
Phi y V de Cramer. Phi es una medida de asociacin basada en chi-cuadrado que conlleva
el error cuando se utilizan los valores de una variable para pronosticar los valores de la otra
variable. Por ejemplo, un valor de 0,83 indica que el conocimiento de una variable reduce en
un 83% el error al pronosticar los valores de la otra variable. El programa calcula tanto la
versin simtrica como la asimtrica del coeficiente de incertidumbre.
Ordinal. Para las tablas en las que tanto las filas como las columnas contienen valores ordenados,
seleccione Gamma (orden cero para tablas de doble clasificacin y condicional para tablas cuyo
factor de clasificacin va de 3 a 10), Tau-b de Kendall y Tau-c de Kendall. Para pronosticar las
categoras de columna de las categoras de fila, seleccione d de Somers.
Gamma. Medida de asociacin simtrica entre dos variables ordinales cuyo valor siempre
est comprendido entre -1 y 1. Los valores prximos a 1, en valor absoluto, indican una
fuerte relacin entre las dos variables. Los valores prximos a cero indican que hay poca o
ninguna relacin entre las dos variables. Para las tablas de doble clasificacin, se muestran las
gammas de orden cero. Para las tablas de tres o ms factores de clasificacin, se muestran
las gammas condicionales.
d de Somers. Medida de asociacin entre dos variables ordinales que toma un valor
comprendido entre -1 y 1. Los valores prximos a 1, en valor absoluto, indican una fuerte
relacin entre las dos variables. Los valores prximos a cero indican que hay poca o ninguna
relacin entre las dos variables. La d de Somers es una extensin asimtrica de gamma que
difiere slo en la inclusin del nmero de pares no empatados en la variable independiente.
Tambin se calcula una versin no simtrica de este estadstico.
309
Tablas de contingencia
que tiene en consideracin los empates. El signo del coeficiente indica la direccin de la
relacin y su valor absoluto indica la fuerza de la relacin. Los valores mayores indican que
la relacin es ms estrecha. Los valores posibles van de -1 a 1, pero un valor de -1 o +1 slo
se puede obtener a partir de tablas cuadradas.
Tau-c de Kendall. Medida no paramtrica de asociacin para variables ordinales que ignora
los empates. El signo del coeficiente indica la direccin de la relacin y su valor absoluto
indica la fuerza de la relacin. Los valores mayores indican que la relacin es ms estrecha.
Los valores posibles van de -1 a 1, pero un valor de -1 o +1 slo se puede obtener a partir
de tablas cuadradas.
Nominal por intervalo. Cuando una variable es categrica y la otra es cuantitativa, seleccione Eta.
Eta. Medida de asociacin cuyo valor siempre est comprendido entre 0 y 1. El valor 0 indica
que no hay asociacin entre las variables de fila y de columna. Los valores cercanos a 1
indican que hay gran relacin entre las variables. Eta resulta apropiada para una variable
dependiente medida en una escala de intervalo (por ejemplo, ingresos) y una variable
independiente con un nmero limitado de categoras (por ejemplo, gnero). Se calculan dos
valores de eta: uno trata la variable de las filas como una variable de intervalo; el otro trata
la variable de las columnas como una variable de intervalo.
Kappa. La kappa de Cohen mide el acuerdo entre las evaluaciones de dos jueces cuando ambos
estn valorando el mismo objeto. Un valor igual a 1 indica un acuerdo perfecto. Un valor igual a 0
indica que el acuerdo no es mejor que el que se obtendra por azar. Kappa slo est disponible
para las tablas cuadradas, en las que ambas variables tienen el mismo nmero de categoras.
Riesgo. Para tablas 2x2, una medida del grado de asociacin entre la presencia de un factor y la
se pueden utilizar para comprobar la independencia entre una variable de factor dicotmica y
una variable de respuesta dicotmica, condicionada por los patrones en las covariables, que
vienen definidos por la variable o variables de las capas (variables de control). Tenga en cuenta
que mientras que otros estadsticos se calculan capa por capa, los estadsticos de Cochran y
Mantel-Haenszel se calculan una sola vez para todas las capas.
310
Captulo 18
Para ayudarle a descubrir las tramas en los datos que contribuyen a una prueba de chi-cuadrado
significativa, el procedimiento Tablas de contingencia muestra las frecuencias esperadas y tres
tipos de residuos (desviaciones) que miden la diferencia entre las frecuencias observadas y
las esperadas. Cada casilla de la tabla puede contener cualquier combinacin de recuentos,
porcentajes y residuos seleccionados.
Recuentos. El nmero de casos realmente observados y el nmero de casos esperados si las
los esperados. Tambin se encuentran disponibles los residuos tipificados y tipificados corregidos.
es el nmero de casos que se esperara encontrar en la casilla si no hubiera relacin entre las
dos variables. Un residuo positivo indica que hay ms casos en la casilla de los que habra en
ella si las variables de fila y columna fueran independientes.
Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados,
que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen
una media de 0 y una desviacin tpica de 1.
Tipificados corregidos. El residuo de una casilla (el valor observado menos el valor
pronosticado) dividido por una estimacin de su error tpico. El residuo tipificado resultante
viene expresado en unidades de desviacin tpica, por encima o por debajo de la media.
311
Tablas de contingencia
Ponderaciones no enteras. Los recuentos de las casillas suelen ser valores enteros, ya que
representan el nmero de casos de cada casilla. Sin embargo, si el archivo de datos est ponderado
en un momento determinado por una variable de ponderacin con valores fraccionarios (por
ejemplo, 1,25), los recuentos de las casillas pueden que tambin sean valores fraccionarios.
Puede truncar o redondear estos valores antes o despus de calcular los recuentos de las casillas o
bien utilizar recuentos de casillas fraccionarios en la presentacin de las tablas y los clculos de
los estadsticos.
Redondear los recuentos de casilla. Las ponderaciones de los casos se utilizan tal cual, pero
Truncar las frecuencias de casilla. Las ponderaciones de los casos se utilizan tal cual, pero
las ponderaciones acumuladas en las casillas se truncan antes de calcular cualquiera de los
estadsticos.
Redondear las ponderaciones de los casos. Se redondean las ponderaciones de los casos antes
de utilizarlas.
Truncar las ponderaciones de los casos. Se truncan las ponderaciones de los casos antes de
utilizarlas.
Sin ajustes. Las ponderaciones de los casos se utilizan tal cual y se utilizan las frecuencias de
casilla fraccionales. Sin embargo, cuando se solicitan Estadsticos exactos (disponibles slo
con la opcin Pruebas exactas), las ponderaciones acumuladas en las casillas se truncan o
redondean antes de calcular los estadsticos de las Pruebas exactas.
Puede ordenar las filas en orden ascendente o descendente de los valores de la variable de fila.
Captulo
19
Resumir
El procedimiento Resumir calcula estadsticos de subgrupo para las variables dentro de las
categoras de una o ms variables de agrupacin. Se cruzan todos los niveles de las variables de
agrupacin. Puede elegir el orden en el que se mostrarn los estadsticos. Tambin se muestran
estadsticos de resumen para cada variable a travs de todas las categoras. Los valores de los
datos en cada categora pueden mostrarse en una lista o suprimirse. Con grandes conjuntos de
datos, tiene la opcin de listar slo los primeros n casos.
Ejemplo. Cul es la media de las ventas por regiones o por tipo de cliente? Podr descubrir que
el importe medio de las ventas es ligeramente superior en la regin occidental respecto a las
dems regiones, y que la media ms alta se da entre los clientes de empresas privadas de la
zona occidental.
Estadsticos. Suma, nmero de casos, media, mediana, mediana agrupada, error tpico de la
media, mnimo, mximo, rango, valor de la variable para la primera categora de la variable de
agrupacin, valor de la variable para la ltima categora de la variable de agrupacin, desviacin
tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje
de la suma total, porcentaje del N total, porcentaje de la suma en, porcentaje de N en, media
geomtrica y media armnica.
Datos. Las variables de agrupacin son variables categricas cuyos valores pueden ser numricos
o de cadena. El nmero de categoras debe ser razonablemente pequeo. Las otras variables deben
poder ordenarse mediante rangos.
Supuestos. Algunos de los estadsticos opcionales de subgrupo, como la media y la desviacin
tpica, se basan en la teora normal y son adecuados para variables cuantitativas con distribuciones
simtricas. Los estadsticos robustos, tales como la mediana y el rango, son adecuados para las
variables cuantitativas que pueden o no cumplir el supuesto de normalidad.
Para obtener resmenes de casos
E En los mens, seleccione:
Analizar
Informes
Resmenes de casos...
312
313
Resumir
Figura 19-1
Cuadro de dilogo Resmenes de casos
Si lo desea, puede:
Pulsar en Opciones para cambiar el ttulo de los resultados, aadir un texto al pie debajo de los
resultados o excluir los casos con valores perdidos.
Seleccionar Mostrar los casos para listar los casos en cada subgrupo. Por defecto, el sistema
enumera slo los 100 primeros casos del archivo. Puede aumentar o disminuir el valor de
Limitar los casos a los primerosn o desactivar ese elemento para enumerar todos los casos.
314
Captulo 19
Resumir: Opciones
Figura 19-2
Cuadro de dilogo Opciones
Resumir permite cambiar el ttulo de los resultados o aadir un texto que aparecer debajo de la
tabla de resultados. Puede controlar el ajuste de las lneas en los ttulos y textos escribiendo \n en
el lugar donde desee insertar una lnea de separacin.
Adems, puede elegir entre mostrar o suprimir los subttulos para los totales e incluir o excluir
los casos con valores perdidos para cualquiera de las variables utilizadas en cualquiera de los
anlisis. A menudo es aconsejable representar los casos perdidos en los resultados con un punto
o un asterisco. Introduzca un carcter, frase o cdigo que desee que aparezca cuando haya un
valor perdido; de lo contrario, no se aplicar ningn tratamiento especial a los casos perdidos en
los resultados.
Resumir: Estadsticos
Figura 19-3
Cuadro de dilogo Estadsticos de informe de resumen
315
Resumir
Puede elegir uno o ms de los siguientes estadsticos de subgrupo para las variables dentro de
cada categora de cada variable de agrupacin: suma, nmero de casos, media, mediana, mediana
agrupada, error tpico de la media, mnimo, mximo, rango, valor de la variable para la primera
categora de la variable de agrupacin, valor de la variable para la ltima categora de la variable
de agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error
tpico de asimetra, porcentaje de la suma total, porcentaje del N total, porcentaje de la suma
en, porcentaje de N en, media geomtrica y media armnica. El orden en el que aparecen los
estadsticos en la lista Estadsticos de casilla es el orden en el que se mostrarn en los resultados.
Tambin se muestran estadsticos de resumen para cada variable a travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos.
Media geomtrica. La raz ensima del producto de los valores de los datos, donde n representa
el nmero de casos.
Mediana agrupada. La mediana calculada para los datos que se codifican en grupos. Por ejemplo,
con datos de edades, si cada valor de los 30 se ha codificado como 35, cada valor de los 40 como 45
y as sucesivamente, la mediana agrupada es la mediana calculada a partir de los datos codificados.
Media armnica. Se utiliza para estimar el tamao promedio de un grupo cuando los tamaos de
las muestras de los grupos no son iguales. La media armnica es el nmero total de muestras
divido por la suma de los inversos de los tamaos de las muestras.
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto central.
Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva
indica que las observaciones se concentran ms y presentan colas ms largas que las de una
distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y
presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos.
Mximo. El mayor valor de una variable numrica.
Media. Una medida de tendencia central. El promedio aritmtico, la suma dividida por el nmero
de casos.
Mediana. Es el valor por encima y por debajo del cual se encuentran la mitad de los casos, el
percentil 50. Si hay un nmero par de casos, la mediana es la media de los dos valores centrales,
cuando los casos se ordenan en orden ascendente o descendente. La mediana es una medida de
tendencia central que no es sensible a los valores atpicos (a diferencia de la media, que puede
resultar afectada por unos pocos valores extremadamente altos o bajos).
Mnimo. Valor ms pequeo de una variable numrica.
N. Nmero de casos (observaciones o registros).
Porcentaje del N total. Porcentaje del nmero total de casos en cada categora.
Porcentaje de la suma total. Porcentaje de la suma total en cada categora.
Rango. Diferencia entre los valores mayor y menor de una variable numrica; el mximo menos
el mnimo.
Asimetra. Medida de la asimetra de una distribucin La distribucin normal es simtrica y tiene
un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva significativa
tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa significativa tiene
316
Captulo 19
una cola izquierda larga. Como regla aproximada, un valor de la asimetra mayor que el doble de
su error tpico se asume que indica una desviacin de la simetra.
Error tpico de la curtosis. La razn de la curtosis sobre su error tpico puede utilizarse como
contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o
mayor que +2). Un valor grande y positivo para la curtosis indica que las colas son ms largas que
las de una distribucin normal; por el contrario, un valor extremo y negativo indica que las colas
son ms cortas (llegando a tener forma de caja como en la distribucin uniforme).
Error tpico de la asimetra. La razn de la asimetra sobre su error tpico puede utilizarse como
contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o
mayor que +2). Un valor grande y positivo para la asimetra indica una cola larga a la derecha; un
valor extremo y negativo indica una cola larga por la izquierda
Suma. Suma o total de todos los valores, a lo largo de todos los casos que no tengan valores
perdidos.
Varianza. Es una medida de dispersin en torno a la media, igual a la suma de las desviaciones al
cuadrado respecto a la media, dividida por el nmero de casos menos 1. La varianza se mide en
unidades que son el cuadrado de las de la variable en cuestin.
Captulo
20
Medias
media, mnimo, mximo, rango, valor de la variable para la primera categora de la variable de
agrupacin, valor de la variable para la ltima categora de la variable de agrupacin, desviacin
tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje
de la suma total, porcentaje del N total, porcentaje de la suma en, porcentaje de N en, media
geomtrica y media armnica. Las opciones incluyen: anlisis de varianza, eta, eta cuadrado
y pruebas de linealidad de R y R2.
Datos. Las variables dependientes son cuantitativas y las independientes son categricas. Los
valores de las variables categricas pueden ser numricos o de cadena.
Supuestos. Algunos de los estadsticos opcionales de subgrupo, como la media y la desviacin
tpica, se basan en la teora normal y son adecuados para variables cuantitativas con distribuciones
simtricas. Los estadsticos robustos, tales como la mediana son adecuados para las variables
cuantitativas que pueden o no cumplir el supuesto de normalidad. El anlisis de varianza es
robusto a las desviaciones de la normalidad, aunque los datos de cada casilla deberan ser
simtricos. El anlisis de varianza tambin supone que los grupos proceden de poblaciones con
la misma varianza. Para comprobar este supuesto, utilice la prueba de homogeneidad de las
varianzas de Levene, disponible en el procedimiento ANOVA de un factor.
Para obtener medias de subgrupo
E En los mens, seleccione:
Analizar
Comparar medias
Medias...
317
318
Captulo 20
Figura 20-1
Cuadro de dilogo Medias
E Si lo desea, pulse en Opciones si desea obtener estadsticos opcionales, una tabla de anlisis de
varianza, eta, eta cuadrado, R, y R2.
319
Medias
Medias: Opciones
Figura 20-2
Cuadro de dilogo Medias: Opciones
Puede elegir uno o ms de los siguientes estadsticos de subgrupo para las variables dentro de
cada categora de cada variable de agrupacin: suma, nmero de casos, media, mediana, mediana
agrupada, error tpico de la media, mnimo, mximo, rango, valor de la variable para la primera
categora de la variable de agrupacin, valor de la variable para la ltima categora de la variable
de agrupacin, desviacin tpica, varianza, curtosis, error tpico de curtosis, asimetra, error
tpico de asimetra, porcentaje de la suma total, porcentaje del N total, porcentaje de la suma en,
porcentaje de N en, media geomtrica, media armnica. Se puede cambiar el orden de aparicin
de los estadsticos de subgrupo. El orden en el que aparecen en la lista Estadsticos de casilla es el
mismo orden que presentarn en los resultados. Tambin se muestran estadsticos de resumen para
cada variable a travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos.
Media geomtrica. La raz ensima del producto de los valores de los datos, donde n representa
el nmero de casos.
Mediana agrupada. La mediana calculada para los datos que se codifican en grupos. Por ejemplo,
con datos de edades, si cada valor de los 30 se ha codificado como 35, cada valor de los 40 como 45
y as sucesivamente, la mediana agrupada es la mediana calculada a partir de los datos codificados.
Media armnica. Se utiliza para estimar el tamao promedio de un grupo cuando los tamaos de
las muestras de los grupos no son iguales. La media armnica es el nmero total de muestras
divido por la suma de los inversos de los tamaos de las muestras.
320
Captulo 20
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto central.
Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva
indica que las observaciones se concentran ms y presentan colas ms largas que las de una
distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y
presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos.
Mximo. El mayor valor de una variable numrica.
Media. Una medida de tendencia central. El promedio aritmtico, la suma dividida por el nmero
de casos.
Mediana. Es el valor por encima y por debajo del cual se encuentran la mitad de los casos, el
percentil 50. Si hay un nmero par de casos, la mediana es la media de los dos valores centrales,
cuando los casos se ordenan en orden ascendente o descendente. La mediana es una medida de
tendencia central que no es sensible a los valores atpicos (a diferencia de la media, que puede
resultar afectada por unos pocos valores extremadamente altos o bajos).
Mnimo. Valor ms pequeo de una variable numrica.
N. Nmero de casos (observaciones o registros).
Porcentaje del N total. Porcentaje del nmero total de casos en cada categora.
Porcentaje de la suma total. Porcentaje de la suma total en cada categora.
Rango. Diferencia entre los valores mayor y menor de una variable numrica; el mximo menos
el mnimo.
Asimetra. Medida de la asimetra de una distribucin La distribucin normal es simtrica y tiene
un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva significativa
tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa significativa tiene
una cola izquierda larga. Como regla aproximada, un valor de la asimetra mayor que el doble de
su error tpico se asume que indica una desviacin de la simetra.
Error tpico de la curtosis. La razn de la curtosis sobre su error tpico puede utilizarse como
contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o
mayor que +2). Un valor grande y positivo para la curtosis indica que las colas son ms largas que
las de una distribucin normal; por el contrario, un valor extremo y negativo indica que las colas
son ms cortas (llegando a tener forma de caja como en la distribucin uniforme).
Error tpico de la asimetra. La razn de la asimetra sobre su error tpico puede utilizarse como
contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o
mayor que +2). Un valor grande y positivo para la asimetra indica una cola larga a la derecha; un
valor extremo y negativo indica una cola larga por la izquierda
Suma. Suma o total de todos los valores, a lo largo de todos los casos que no tengan valores
perdidos.
Varianza. Es una medida de dispersin en torno a la media, igual a la suma de las desviaciones al
cuadrado respecto a la media, dividida por el nmero de casos menos 1. La varianza se mide en
unidades que son el cuadrado de las de la variable en cuestin.
321
Medias
Captulo
21
Cubos OLAP
El procedimiento Cubos OLAP (siglas del ingls On-Line Analytic Processing, Procesamiento
analtico interactivo) calcula totales, medias y otros estadsticos univariantes para variables de
resumen continuas dentro de las categoras de una o ms variables categricas de agrupacin. En
la tabla se crear una nueva capa para cada categora de cada variable de agrupacin.
Ejemplo. El total y el promedio de ventas para diversas regiones y lneas de producto, dentro
de las regiones.
Estadsticos. Suma, nmero de casos, media, mediana, mediana agrupada, error tpico de la media,
mnimo, mximo, rango, valor de la variable para la primera categora de la variable de agrupacin,
valor de la variable para la ltima categora de la variable de agrupacin, desviacin tpica,
varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra, porcentaje de casos
totales, porcentaje de la suma total, porcentaje de casos totales dentro de las variables agrupadas,
porcentaje de la suma total dentro de las variables agrupadas, media geomtrica y media armnica.
Datos. Las variables de resumen son cuantitativas (variables continuas medidas en una escala de
intervalo o de razn) y las variables de agrupacin son categricas. Los valores de las variables
categricas pueden ser numricos o de cadena.
Supuestos. Algunos de los estadsticos opcionales de subgrupo, como la media y la desviacin
tpica, se basan en la teora normal y son adecuados para variables cuantitativas con distribuciones
simtricas. Los estadsticos robustos, tales como la mediana y el rango, son adecuados para las
variables cuantitativas que pueden o no cumplir el supuesto de normalidad.
Para obtener cubos OLAP
E En los mens, seleccione:
Analizar
Informes
Cubos OLAP...
322
323
Cubos OLAP
Figura 21-1
Cuadro de dilogo Cubos OLAP
Si lo desea:
Calcule las diferencias existentes entre los pares de variables y los pares de grupos definidos
por una variable de agrupacin (pulse en Diferencias).
324
Captulo 21
Puede elegir uno o varios de los siguientes estadsticos de subgrupo para las variables de resumen
dentro de cada categora de cada variable de agrupacin: Suma, Nmero de casos, Media,
Mediana, Mediana agrupada, Error tpico de la media, Mnimo, Mximo, Rango, Valor de la
variable para la primera categora de la variable de agrupacin, Valor de la variable para la ltima
categora de la variable de agrupacin, Desviacin tpica, Varianza, Curtosis, Error tpico de
curtosis, Asimetra, Error tpico de asimetra, Porcentaje de casos totales, Porcentaje de la suma
total, Porcentaje de casos totales dentro de las variables de agrupacin, Porcentaje de la suma total
dentro de las variables de agrupacin, Media geomtrica y Media armnica.
Se puede cambiar el orden de aparicin de los estadsticos de subgrupo. El orden en el que
aparecen en la lista Estadsticos de casilla es el mismo orden que presentarn en los resultados.
Tambin se muestran estadsticos de resumen para cada variable a travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos.
Media geomtrica. La raz ensima del producto de los valores de los datos, donde n representa
el nmero de casos.
Mediana agrupada. La mediana calculada para los datos que se codifican en grupos. Por ejemplo,
con datos de edades, si cada valor de los 30 se ha codificado como 35, cada valor de los 40 como 45
y as sucesivamente, la mediana agrupada es la mediana calculada a partir de los datos codificados.
Media armnica. Se utiliza para estimar el tamao promedio de un grupo cuando los tamaos de
las muestras de los grupos no son iguales. La media armnica es el nmero total de muestras
divido por la suma de los inversos de los tamaos de las muestras.
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto central.
Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva
indica que las observaciones se concentran ms y presentan colas ms largas que las de una
distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y
presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos.
Mximo. El mayor valor de una variable numrica.
Media. Una medida de tendencia central. El promedio aritmtico, la suma dividida por el nmero
de casos.
Mediana. Es el valor por encima y por debajo del cual se encuentran la mitad de los casos, el
percentil 50. Si hay un nmero par de casos, la mediana es la media de los dos valores centrales,
cuando los casos se ordenan en orden ascendente o descendente. La mediana es una medida de
tendencia central que no es sensible a los valores atpicos (a diferencia de la media, que puede
resultar afectada por unos pocos valores extremadamente altos o bajos).
Mnimo. Valor ms pequeo de una variable numrica.
N. Nmero de casos (observaciones o registros).
Porcentaje del N en. Porcentaje del nmero de casos para la variable de agrupacin especificada
dentro de las categoras de otras variables de agrupacin. Si slo tiene una variable de agrupacin,
este valor es idntico al porcentaje del nmero de casos total.
325
Cubos OLAP
Porcentaje de la suma en. Porcentaje de la suma para la variable de agrupacin especificada dentro
de las categoras de otras variables de agrupacin. Si slo tiene una variable de agrupacin, este
valor es idntico al porcentaje de la suma total.
Porcentaje del N total. Porcentaje del nmero total de casos en cada categora.
Porcentaje de la suma total. Porcentaje de la suma total en cada categora.
Rango. Diferencia entre los valores mayor y menor de una variable numrica; el mximo menos
el mnimo.
Asimetra. Medida de la asimetra de una distribucin La distribucin normal es simtrica y tiene
un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva significativa
tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa significativa tiene
una cola izquierda larga. Como regla aproximada, un valor de la asimetra mayor que el doble de
su error tpico se asume que indica una desviacin de la simetra.
Error tpico de la curtosis. La razn de la curtosis sobre su error tpico puede utilizarse como
contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o
mayor que +2). Un valor grande y positivo para la curtosis indica que las colas son ms largas que
las de una distribucin normal; por el contrario, un valor extremo y negativo indica que las colas
son ms cortas (llegando a tener forma de caja como en la distribucin uniforme).
Error tpico de la asimetra. La razn de la asimetra sobre su error tpico puede utilizarse como
contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn es menor que -2 o
mayor que +2). Un valor grande y positivo para la asimetra indica una cola larga a la derecha; un
valor extremo y negativo indica una cola larga por la izquierda
Suma. Suma o total de todos los valores, a lo largo de todos los casos que no tengan valores
perdidos.
Varianza. Es una medida de dispersin en torno a la media, igual a la suma de las desviaciones al
cuadrado respecto a la media, dividida por el nmero de casos menos 1. La varianza se mide en
unidades que son el cuadrado de las de la variable en cuestin.
326
Captulo 21
Este cuadro de dilogo le permite calcular el porcentaje y las diferencias aritmticas entre
las variables de resumen o entre los grupos definidos por una variable de agrupacin. Las
diferencias se calculan para todas las medidas seleccionadas en el cuadro de dilogo Cubos
OLAP: Estadsticos.
Diferencias entre variables. Calcula las diferencias entre pares de variables. Los valores de los
estadsticos de resumen para la segunda variable de cada par (la variable Menos) se restan de los
valores de los estadsticos de resumen correspondientes a la primera variable del par. En cuanto a
las diferencias de porcentaje, el valor de la variable de resumen para la variable Menos es el que
se usa como denominador. Debe seleccionar al menos dos variables de resumen en el cuadro de
dilogo principal para poder especificar las diferencias entre las variables.
Diferencias entre grupos de casos. Calcula las diferencias entre pares de grupos definidos
por una variable de agrupacin. Los valores de los estadsticos de resumen para la segunda
categora de cada par (la variable Menos) se restan de los valores de los estadsticos de resumen
correspondientes a la primera categora del par. Las diferencias de porcentaje utilizan el valor del
estadstico de resumen de la categora Menos como denominador. Debe seleccionar una o ms
variables de agrupacin en el cuadro de dilogo principal para poder especificar las diferencias
entre los grupos.
327
Cubos OLAP
Puede cambiar el ttulo de los resultados o aadir un texto al pie que aparecer debajo de la tabla
de resultados. Tambin puede controlar el ajuste de las lneas de los ttulos y de los textos al pie
escribiendo \n en el lugar del texto donde desee insertar una lnea de separacin.
Captulo
22
Pruebas T
Hay tres tipos de pruebas t:
Prueba T para muestras independientes (prueba T para dos muestras). Compara las medias de una
variable para dos grupos de casos. Se ofrecen estadsticos descriptivos para cada grupo y la
prueba de Levene sobre la igualdad de las varianzas, as como valores t de igualdad de varianzas y
varianzas desiguales y un intervalo de confianza al 95% para la diferencia entre las medias.
Prueba T para muestras relacionadas (prueba T dependiente). Compara las medias de dos variables
en un solo grupo. Esta prueba tambin se utiliza para pares relacionados o diseos de estudio de
control de casos. El resultado incluye estadsticos descriptivos de las variables que se van a
contrastar, la correlacin entre ellas, estadsticos descriptivos de las diferencias emparejadas, la
prueba t y un intervalo de confianza al 95%.
Prueba t para una muestra. Compara la media de una variable con un valor conocido o hipotetizado.
Se muestran estadsticos descriptivos para las variables de contraste junto con la prueba t. Por
defecto, en los resultados se incluye un intervalo de confianza al 95% para la diferencia entre la
media de la variable de contraste y el valor hipotetizado de la prueba.
media. Para la diferencia entre las medias: media, error tpico e intervalo de confianza (puede
especificar el nivel de confianza). Pruebas: prueba de Levene sobre la igualdad de varianzas y
pruebas t de varianzas combinadas y separadas sobre la igualdad de las medias.
328
329
Pruebas T
Datos. Los valores de la variable cuantitativa de inters se hallan en una nica columna del archivo
de datos. El procedimiento utiliza una variable de agrupacin con dos valores para separar los
casos en dos grupos. La variable de agrupacin puede ser numrica (valores como 1 y 2, o 6,25 y
12,5) o de cadena corta (como s y no). Tambin puede usar una variable cuantitativa, como la
edad, para dividir los casos en dos grupos especificando un punto de corte (el punto de corte 21
divide la edad en un grupo de menos de 21 aos y otro de ms de 21).
Supuestos. Para la prueba t de igualdad de varianzas, las observaciones deben ser muestras
E Seleccione una o ms variables de contraste cuantitativas. Se calcula una prueba t para cada
variable.
E Seleccione una sola variable de agrupacin y pulse en Definir grupos para especificar dos cdigos
330
Captulo 22
Para las variables de agrupacin numricas, defina los dos grupos de la prueba t especificando dos
valores o un punto de corte:
Usar valores especificados. Escriba un valor para el Grupo 1 y otro para el Grupo 2. Los casos
con otros valores quedarn excluidos del anlisis. Los nmeros no tienen que ser enteros (por
ejemplo, 6,25 y 12,5 son vlidos).
Punto de corte. Escriba un nmero que divida los valores de la variable de agrupacin en dos
conjuntos. Todos los casos con valores menores que el punto de corte forman un grupo y los
casos con valores mayores o iguales que el punto de corte forman el otro grupo.
Figura 22-3
Cuadro de dilogo Definir grupos para variables de cadena
Para las variables de agrupacin de cadena, escriba una cadena para el Grupo 1 y otra para el
Grupo 2; por ejemplo s y no. Los casos con otras cadenas se excluyen del anlisis.
331
Pruebas T
Intervalo de confianza. Por defecto se muestra un intervalo de confianza al 95% para la diferencia
entre las medias. Introduzca un valor entre 1 y 99 para solicitar otro nivel de confianza.
Valores perdidos. Si ha probado varias variables y se han perdido los datos de una o ms de ellas,
puede indicar al procedimiento qu casos desea incluir (o excluir).
Excluir casos segn anlisis. Cada prueba t utiliza todos los casos que tienen datos vlidos
para las variables contrastadas. Los tamaos muestrales pueden variar de una prueba a otra.
Excluir casos segn lista. Cada prueba t utiliza slo aquellos casos que contienen datos
vlidos para todas las variables utilizadas en las pruebas t solicitadas. El tamao muestral
es constante en todas las pruebas.
al comienzo del estudio, se les aplica un tratamiento y se les toma la tensin otra vez. De esta
manera, a cada paciente le corresponden dos medidas, normalmente denominadas medidas pre
y post. Un diseo alternativo para el que se utiliza esta prueba consiste en un estudio de pares
relacionados o un estudio de control de casos en el que cada registro en el archivo de datos
contiene la respuesta del paciente y de su sujeto de control correspondiente. En un estudio sobre la
tensin sangunea, pueden emparejarse pacientes y controles por edad (un paciente de 75 aos con
un miembro del grupo de control de 75 aos).
Estadsticos. Para cada variable: media, tamao muestral, desviacin tpica y error tpico de la
media. Para cada pareja de variables: correlacin, diferencia promedio entre las medias, prueba t
de intervalo de confianza para la diferencia entre las medias (puede especificarse el nivel de
confianza). Desviacin tpica y error tpico de la diferencia entre las medias.
Datos. Especifique dos variables cuantitativas (nivel de medida de intervalo o de razn) para cada
diferencias entre las medias deben estar normalmente distribuidas. Las varianzas de cada variable
pueden ser iguales o desiguales.
Para obtener una prueba T para muestras relacionadas
E En los mens, seleccione:
Analizar
Comparar medias
Prueba T para muestras relacionadas...
332
Captulo 22
Figura 22-5
Cuadro de dilogo Prueba T para muestras relacionadas
Intervalo de confianza. Por defecto se muestra un intervalo de confianza al 95% para la diferencia
entre las medias. Introduzca un valor entre 1 y 99 para solicitar otro nivel de confianza.
Valores perdidos. Si ha probado varias variables y se han perdido los datos de una o ms de ellas,
puede indicar al procedimiento qu casos desea incluir (o excluir):
Excluir casos segn anlisis. Cada prueba t utilizar todos los casos que contienen datos
vlidos para la pareja de variables contrastadas. Los tamaos muestrales pueden variar de una
prueba a otra.
Excluir casos segn lista. Cada prueba t utilizar nicamente los casos que contengan datos
vlidos para todas las parejas de variables contrastadas. El tamao muestral es constante
en todas las pruebas.
333
Pruebas T
334
Captulo 22
Intervalo de confianza. Por defecto se muestra un intervalo de confianza al 95% para la diferencia
entre la media y el valor de contraste hipotetizado. Introduzca un valor entre 1 y 99 para solicitar
otro nivel de confianza.
Valores perdidos. Si ha probado varias variables y se han perdido los datos de una o ms de ellas,
Excluir casos segn anlisis. Cada prueba t utiliza todos los casos que tienen datos vlidos
para la variable contrastada. Los tamaos muestrales pueden variar de una prueba a otra.
Excluir casos segn lista. Cada prueba t utiliza slo aquellos casos que contienen datos
vlidos para todas las variables utilizadas en las pruebas t solicitadas. El tamao muestral
es constante en todas las pruebas.
Producir pruebas t tanto de una sola muestra como de muestras independientes ejecutando un
solo comando.
Contrastar una variable con todas las variables de una lista, en una prueba relacionada
(mediante el subcomando PAIRS).
Captulo
ANOVA de un factor
23
media, mnimo, mximo, intervalo de confianza al 95% para la media. Prueba de Levene
sobre la homogeneidad de varianzas, tabla de anlisis de varianza y contrastes robustos de
igualdad de medias para cada variable dependiente, contrastes a priori especificados por el
usuario y las pruebas de rango y de comparaciones mltiples post hoc: Bonferroni, Sidak,
diferencia honestamente significativa de Tukey, GT2 de Hochberg, Gabriel, Dunnett, prueba F
de Ryan-Einot-Gabriel-Welsch, (R-E-G-W F), prueba de rango de Ryan-Einot-Gabriel-Welsch
(R-E-G-W Q), T2 de Tamhane, T3 de Dunnett, Games-Howell, C, de Dunnett, prueba de rango
mltiple de Duncan, Student-Newman-Keuls (S-N-K), b de Tukey, Waller-Duncan, Scheff y
diferencia menos significativa.
Datos. Los valores de la variable de factor deben ser enteros y la variable dependiente debe ser
normal. El anlisis de varianza es robusto a las desviaciones de la normalidad, aunque los datos
debern ser simtricos. Los grupos deben proceder de poblaciones con varianzas iguales. Para
contrastar este supuesto, utilice la prueba de Levene de homogeneidad de varianzas.
335
336
Captulo 23
337
ANOVA de un factor
Coeficientes. Contrastes a priori especificados por el usuario que sern contrastados mediante el
estadstico t. Introduzca un coeficiente para cada grupo (categora) de la variable factor y pulse en
Aadir despus de cada entrada. Cada nuevo valor se aade al final de la lista de coeficientes. Para
especificar conjuntos de contrastes adicionales, pulse en Siguiente. Utilice Siguiente y Anterior para
desplazarse por los conjuntos de contrastes.
El orden de los coeficientes es importante porque se corresponde con el orden ascendente de los
valores de las categoras de la variable de factor. El primer coeficiente en la lista se corresponde
con el menor de los valores de grupo en la variable de factor y el ltimo coeficiente se corresponde
con el valor ms alto. Por ejemplo, si existen seis categoras en la variable factor, los coeficientes
1, 0, 0, 0, 0,5 y 0,5 contrastan el primer grupo con los grupos quinto y sexto. Para la mayora de
las aplicaciones, la suma de los coeficientes debera ser 0. Los conjuntos que no sumen 0 tambin
se pueden utilizar, pero aparecer un mensaje de advertencia.
Una vez que se ha determinado que existen diferencias entre las medias, las pruebas de rango
post hoc y las comparaciones mltiples por parejas permiten determinar qu medias difieren.
Las pruebas de rango identifican subconjuntos homogneos de medias que no se diferencian
entre s. Las comparaciones mltiples por parejas contrastan la diferencia entre cada pareja de
medias y generan una matriz donde los asteriscos indican las medias de grupo significativamente
diferentes a un nivel alfa de 0,05.
338
Captulo 23
LSD. Utiliza pruebas t para realizar todas las comparaciones por pares entre las medias de los
Bonferroni. Utiliza las pruebas de t para realizar comparaciones por pares entre las medias de
los grupos, pero controla la tasa de error global estableciendo que la tasa de error de cada
prueba sea igual a la tasa de error por experimento dividida entre el nmero total de contrastes.
As, se corrige el nivel crtico por el hecho de que se estn realizando mltiples comparaciones.
Scheff. Realiza comparaciones mltiples conjuntas por parejas para todas las parejas de
una prueba F.
en el rango estudentizado.
S-N-K. Realiza todas las comparaciones por parejas entre las medias utilizando la distribucin
del rango de Student. Con tamaos de muestras iguales, tambin compara pares de medias
dentro de subconjuntos homogneos utilizando un procedimiento por pasos Las medias se
ordenan de mayor a menor y se comparan primero las diferencias ms extremas.
Tukey. Utiliza el estadstico del rango estudentizado para realizar todas las comparaciones por
pares entre los grupos. Establece la tasa de error por experimento como la tasa de error para el
conjunto de todas las comparaciones por pares.
Tukey-b. Prueba que emplea la distribucin del rango estudentizado para realizar
comparaciones por pares entre los grupos. El valor crtico es el promedio de los valores
correspondientes a la diferencia honestamente significativa de Tukey y al mtodo de
Student-Newman-Keuls.
Duncan. Realiza comparaciones por pares utilizando un orden por pasos idntico al orden
GT2 de Hochberg. Prueba de comparaciones mltiples y de rango que utiliza el mdulo mximo
339
ANOVA de un factor
Gabriel. Prueba de comparacin por parejas que utiliza el mdulo mximo estudentizado y
que es generalmente ms potente que la GT2 de Hochberg, si los tamaos de las casillas
son desiguales. La prueba de Gabriel se puede convertir en liberal cuando los tamaos de
las casillas varan mucho.
aproximacin Bayesiana.
Las pruebas de comparaciones mltiples que no suponen varianzas iguales son T2 de Tamhane,
T3 de Dunnett, Games-Howell y C de Dunnett.
T2 de Tamhane. Prueba de comparaciones mltiples por parejas basada en una prueba t. Esta
Games-Howell. Prueba de comparacin por parejas que es en ocasiones liberal. Esta prueba es
340
Captulo 23
Descriptivos. Calcula los siguientes estadsticos: Nmero de casos, Media, Desviacin tpica,
Error tpico de la media, Mnimo, Mximo y los Intervalos de confianza al 95% de cada
variable dependiente para cada grupo.
Efectos fijos y aleatorios. Muestra la desviacin tpica, el error tpico y un intervalo de confianza
del 95% para el modelo de efectos fijos, y el error tpico, un intervalo de confianza del 95% y
una estimacin de la varianza entre componentes para el modelo de efectos aleatorios.
igualdad de las varianzas de grupo. Esta prueba no depende del supuesto de normalidad.
Welch. Calcula el estadstico de Welch para contrastar la igualdad de las medias de grupo.
Excluir casos segn anlisis. Un caso que tenga un valor perdido para la variable dependiente
Excluir casos segn lista. Se excluyen de todos los anlisis los casos con valores perdidos para
341
ANOVA de un factor
Obtener estadsticos de efectos fijos y aleatorios. Desviacin tpica, error tpico de la media
e intervalos de confianza al 95% para el modelo de efectos fijos. Error tpico, intervalos de
confianza al 95% y estimacin de la varianza entre componentes para el modelo de efectos
aleatorios (mediante STATISTICS=EFFECTS).
Escribir una matriz de medias, desviaciones tpicas y frecuencias, o leer una matriz de medias,
frecuencias, varianzas combinadas y grados de libertad para las varianzas combinadas. Estas
matrices pueden utilizarse en lugar de los datos brutos para obtener un anlisis de varianza
de un factor (con el subcomando MATRIX).
Captulo
24
aos. El tiempo final de cada corredor es la variable dependiente. Influyen otros factores como el
clima (fro, calor o temperatura agradable), los meses de entrenamiento, el nmero de maratones
anteriores y el sexo. La edad se considera una covariable. Observar que el sexo es un efecto
significativo y que la interaccin del sexo con el clima es significativa.
Mtodos. Las sumas de cuadrados de Tipo I, Tipo II, Tipo III y Tipo IV pueden emplearse para
evaluar las diferentes hiptesis. Tipo III es el valor por defecto.
Estadsticos. Las pruebas de rango post hoc y las comparaciones mltiples: Diferencia menos
343
MLG Anlisis univariante
tpicas y frecuencias de todas las variables dependientes en todas las casillas. Prueba de Levene
para la homogeneidad de varianzas.
Diagramas. Diagramas de dispersin por nivel, grficos de residuos, grficos de perfil (interaccin).
Datos. La variable dependiente es cuantitativa. Los factores son categricos; pueden tener
valores numricos o valores de cadena de hasta ocho caracteres. Pueden tener valores numricos
o valores de cadena de hasta ocho caracteres. Las covariables son variables cuantitativas que
estn relacionadas con la variable dependiente.
Supuestos. Los datos son una muestra aleatoria de una poblacin normal; en la poblacin, todas
las varianzas de las casillas son iguales. El anlisis de varianza es robusto a las desviaciones de la
normalidad, aunque los datos debern ser simtricos. Para comprobar los supuestos, puede utilizar
la prueba de homogeneidad de varianzas y los grficos de dispersin por nivel. Tambin puede
examinar los residuos y los grficos de residuos.
Para obtener un anlisis MLG Univariante
E Elija en los mens:
Analizar
Modelo lineal general
Univariante...
Figura 24-1
Cuadro de dilogo MLG Univariante
344
Captulo 24
MLG: Modelo
Figura 24-2
Cuadro de dilogo Univariante: Modelo
Especificar modelo. Un modelo factorial completo contiene todos los efectos principales del
factor, todos los efectos principales de las covariables y todas las interacciones factor por factor.
No contiene interacciones de covariable. Seleccione Personalizado para especificar slo un
subconjunto de interacciones o para especificar interacciones factor por covariable. Indique todos
los trminos que desee incluir en el modelo.
Factores y Covariables. Muestra una lista de los factores y las covariables.
Modelo. El modelo depende de la naturaleza de los datos. Despus de seleccionar Personalizado,
puede elegir los efectos principales y las interacciones que sean de inters para el anlisis.
Suma de cuadrados. Determina el mtodo para calcular las sumas de cuadrados. Para los modelos
equilibrados y no equilibrados sin casillas perdidas, el mtodo ms utilizado para la suma de
cuadrados es el Tipo III.
Incluir la interseccin en el modelo. La interseccin se incluye normalmente en el modelo. Si
supone que los datos pasan por el origen, puede excluir la interseccin.
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
345
MLG Anlisis univariante
Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas.
Todas de 4. Crea todas las interacciones cudruples posibles de las variables seleccionadas.
Todas de 5. Crea todas las interacciones quntuples posibles de las variables seleccionadas.
Suma de cuadrados
Para el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms utilizado y
es el tipo por defecto.
Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica de la suma
de cuadrados. Cada trmino se corrige slo respecto al trmino que le precede en el modelo. El
mtodo Tipo I para la obtencin de sumas de cuadrados se utiliza normalmente para:
Un modelo puramente anidado en el que el primer efecto especificado est anidado dentro del
segundo efecto especificado, el segundo efecto especificado est anidado dentro del tercero,
y as sucesivamente. Esta forma de anidamiento solamente puede especificarse utilizando
la sintaxis.
Tipo II. Este mtodo calcula cada suma de cuadrados del modelo considerando slo los efectos
pertinentes. Un efecto pertinente es el que corresponde a todos los efectos que no contienen el
que se est examinando. El mtodo Tipo II para la obtencin de sumas de cuadrados se utiliza
normalmente para:
Tipo III. Es el mtodo por defecto. Este mtodo calcula las sumas de cuadrados de un efecto
del diseo como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo
contenga y ortogonales a cualquier efecto (si existe) que lo contenga. Las sumas de cuadrados de
Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla, siempre
que la forma general de estimabilidad permanezca constante. As, este tipo de sumas de cuadrados
se suele considerar de gran utilidad para un modelo no equilibrado sin casillas perdidas. En un
diseo factorial sin casillas perdidas, este mtodo equivale a la tcnica de cuadrados ponderados
de las medias de Yates. El mtodo Tipo III para la obtencin de sumas de cuadrados se utiliza
normalmente para:
346
Captulo 24
Tipo IV. Este mtodo est diseado para una situacin en la que hay casillas perdidas. Para
cualquier efecto F en el diseo, si F no est contenida en cualquier otro efecto, entonces Tipo IV =
Tipo III = Tipo II. Cuando F est contenida en otros efectos, el Tipo IV distribuye equitativamente
los contrastes que se realizan entre los parmetros en F a todos los efectos de nivel superior. El
mtodo Tipo IV para la obtencin de sumas de cuadrados se utiliza normalmente para:
MLG: Contrastes
Figura 24-3
Cuadro de dilogo Univariante: Contrastes
Los contrastes se utilizan para contrastar las diferencias entre los niveles de un factor. Puede
especificar un contraste para cada factor en el modelo (en un modelo de medidas repetidas, para
cada factor inter-sujetos). Los contrastes representan las combinaciones lineales de los parmetros.
El contraste de hiptesis se basa en la hiptesis nula LB = 0, donde L es la matriz de
coeficientes de contraste y B es el vector de parmetros. Cuando se especifica un contraste, se crea
una matriz L. Las columnas de la matriz L correspondientes al factor coinciden con el contraste.
El resto de las columnas se corrigen para que la matriz L sea estimable.
Los resultados incluyen un estadstico F para cada conjunto de contrastes. Para el contraste
de diferencias tambin se muestran los intervalos de confianza simultneos de tipo Bonferroni
basados en la distribucin t de Student.
Contrastes disponibles
Tipos de contrastes
Desviacin. Compara la media de cada nivel (excepto una categora de referencia) con la media de
todos los niveles (media global). Los niveles del factor pueden colocarse en cualquier orden.
347
MLG Anlisis univariante
Simple. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de
contraste resulta til cuando existe un grupo de control. Puede seleccionar la primera o la ltima
categora como referencia.
Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los niveles
niveles siguientes.
Repetidas. Compara la media de cada nivel (excepto el ltimo) con la media del nivel siguiente.
Polinmico. Compara el efecto lineal, cuadrtico, cbico, etc. El primer grado de libertad contiene
el efecto lineal a travs de todas las categoras; el segundo grado de libertad, el efecto cuadrtico, y
as sucesivamente. Estos contrastes se utilizan a menudo para estimar las tendencias polinmicas.
Los grficos de perfil (grficos de interaccin) sirven para comparar las medias marginales en el
modelo. Un grfico de perfil es un grfico de lneas en el que cada punto indica la media marginal
estimada de una variable dependiente (corregida respecto a las covariables) en un nivel de un
factor. Los niveles de un segundo factor se pueden utilizar para generar lneas diferentes. Cada
nivel en un tercer factor se puede utilizar para crear un grfico diferente. Todos los factores fijos
y aleatorios, si existen, estn disponibles para los grficos. Para los anlisis multivariantes, los
grficos de perfil se crean para cada variable dependiente. En un anlisis de medidas repetidas,
es posible utilizar tanto los factores inter-sujetos como los intra-sujetos en los grficos de perfil.
Las opciones MLG - Multivariante y MLG - Medidas repetidas slo estarn disponibles si tiene
instalada la opcin Estadsticas avanzadas.
348
Captulo 24
Despus de especificar un grfico mediante la seleccin de los factores del eje horizontal y, de
manera opcional, los factores para distintas lneas y grficos, el grfico deber aadirse a la
lista de grficos.
Pruebas de comparaciones mltiples post hoc. Una vez que se ha determinado que existen
diferencias entre las medias, las pruebas de rango post hoc y las comparaciones mltiples por
parejas permiten determinar qu medias difieren. Las comparaciones se realizan sobre valores sin
corregir. Estas pruebas se utilizan nicamente para factores inter-sujetos fijos. En MLG Medidas
349
MLG Anlisis univariante
repetidas, estas pruebas no estn disponibles si no existen factores inter-sujetos y las pruebas de
comparacin mltiple post hoc se realizan para la media a travs de los niveles de los factores
intra-sujetos. Para MLG - Multivariante, las pruebas post hoc se realizan por separado para cada
variable dependiente. Las opciones MLG - Multivariante y MLG - Medidas repetidas slo estarn
disponibles si tiene instalada la opcin Estadsticas avanzadas.
Las pruebas de diferencia honestamente significativa de Tukey y de Bonferroni son pruebas de
comparacin mltiple muy utilizadas. La prueba de Bonferroni, basada en el estadstico t de
Student, corrige el nivel de significacin observado por el hecho de que se realizan comparaciones
mltiples. La prueba t de Sidak tambin corrige el nivel de significacin y da lugar a lmites ms
estrechos que los de Bonferroni. La prueba de diferencia honestamente significativa de Tukey
utiliza el estadstico del rango estudentizado para realizar todas las comparaciones por pares entre
los grupos y establece la tasa de error por experimento como la tasa de error para el conjunto de
todas las comparaciones por pares. Cuando se contrasta un gran nmero de pares de medias, la
prueba de la diferencia honestamente significativa de Tukey es ms potente que la prueba de
Bonferroni. Para un nmero reducido de pares, Bonferroni es ms potente.
GT2 de Hochberg es similar a la prueba de la diferencia honestamente significativa de
Tukey, pero se utiliza el mdulo mximo estudentizado. La prueba de Tukey suele ser ms
potente. La prueba de comparacin por parejas de Gabriel tambin utiliza el mdulo mximo
estudentizado y es generalmente ms potente que la GT2 de Hochberg cuando los tamaos de las
casillas son desiguales. La prueba de Gabriel se puede convertir en liberal cuando los tamaos de
las casillas varan mucho.
La prueba t de comparacin mltiple por parejas de Dunnett compara un conjunto de
tratamientos con una media de control simple. La ltima categora es la categora de control por
defecto. Si lo desea, puede seleccionar la primera categora. Asimismo, puede elegir una prueba
unilateral o bilateral. Para comprobar que la media de cualquier nivel del factor (excepto la
categora de control) no es igual a la de la categora de control, utilice una prueba bilateral. Para
contrastar si la media en cualquier nivel del factor es menor que la de la categora de control,
seleccione < Control. Asimismo, para contrastar si la media en cualquier nivel del factor es mayor
que la de la categora de control, seleccione > Control.
Ryan, Einot, Gabriel y Welsch (R-E-G-W) desarrollaron dos pruebas de rangos mltiples por
pasos. Los procedimientos mltiples por pasos (por tamao de las distancias) contrastan en
primer lugar si todas las medias son iguales. Si no son iguales, se contrasta la igualdad en los
subconjuntos de medias. R-E-G-W F se basa en una prueba F y R-E-G-W Q se basa en un rango
estudentizado. Estas pruebas son ms potentes que la prueba de rangos mltiples de Duncan
y Student-Newman-Keuls (que tambin son procedimientos mltiples por pasos), pero no se
recomiendan para tamaos de casillas desiguales.
Cuando las varianzas son desiguales, utilice T2 de Tamhane (prueba conservadora de
comparacin por parejas basada en una prueba t), T3 de Dunnett (prueba de comparacin
por parejas basada en el mdulo mximo estudentizado), prueba de comparacin por
parejasGames-Howell (a veces liberal), o C de Dunnett (prueba de comparacin por parejas
basada en el rango estudentizado). Tenga en cuenta que estas pruebas no son vlidas y no se
realizarn si el modelo tiene mltiples factores.
La prueba de rango mltiple de Duncan, Student-Newman-Keuls (S-N-K) y b de Tukey
son pruebas de rango que asignan rangos a medias de grupo y calculan un valor de rango. Estas
pruebas no se utilizan con la misma frecuencia que las pruebas anteriormente mencionadas.
350
Captulo 24
MLG: Guardar
Figura 24-7
Cuadro de dilogo Guardar
Es posible guardar los valores pronosticados por el modelo, los residuos y las medidas
relacionadas como variables nuevas en el Editor de datos. Muchas de estas variables se pueden
utilizar para examinar supuestos sobre los datos. Si desea almacenar los valores para utilizarlos en
otra sesin de SPSS Statistics, gurdelos en el archivo de datos actual.
Valores pronosticados. Son los valores que predice el modelo para cada caso.
351
MLG Anlisis univariante
Error tpico. Estimacin de la desviacin tpica del valor promedio de la variable dependiente
para los casos que tengan los mismos valores en las variables independientes.
Diagnsticos. Son medidas para identificar casos con combinaciones poco usuales de valores para
los casos y las variables independientes que puedan tener un gran impacto en el modelo.
Distancia de Cook. Una medida de cunto cambiaran los residuos de todos los casos si un
caso particular se excluyera del clculo de los coeficientes de regresin. Una Distancia de
Cook grande indica que la exclusin de ese caso del clculo de los estadsticos de regresin
har variar substancialmente los coeficientes.
Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados,
que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen
una media de 0 y una desviacin tpica de 1.
Mtodo de Student. Residuo dividido por una estimacin de su desviacin tpica que vara
de caso en caso, dependiendo de la distancia de los valores de cada caso en las variables
independientes respecto a las medias en las variables independientes.
Eliminados. Residuo para un caso cuando ste se excluye del clculo de los coeficientes de
352
Captulo 24
Opciones MLG
Figura 24-8
Cuadro de dilogo Opciones
Este cuadro de dilogo contiene estadsticos opcionales. Los estadsticos se calculan utilizando
un modelo de efectos fijos.
Medias marginales estimadas. Seleccione los factores e interacciones para los que desee obtener
estimaciones de las medias marginales de la poblacin en las casillas. Estas medias se corrigen
respecto a las covariables, si las hay.
Comparar los efectos principales. Proporciona comparaciones por parejas no corregidas entre
las medias marginales estimadas para cualquier efecto principal del modelo, tanto para los
factores inter-sujetos como para los intra-sujetos. Este elemento slo se encuentra disponible
si los efectos principales estn seleccionados en la lista Mostrar las medias para.
(DMS), Bonferroni o Sidak para los intervalos de confianza y la significacin. Este elemento
slo estar disponible si se selecciona Comparar los efectos principales.
Mostrar. Seleccione Estadsticos descriptivos para generar medias observadas, desviaciones tpicas
y frecuencias para cada variable dependiente en todas las casillas. La opcin Estimaciones del
tamao del efecto ofrece un valor parcial de eta-cuadrado para cada efecto y cada estimacin de
parmetros. El estadstico eta cuadrado describe la proporcin de variabilidad total atribuible a un
factor. Seleccione Potencia observada para obtener la potencia de la prueba cuando la hiptesis
alternativa se ha establecido basndose en el valor observado. Seleccione Estimaciones de los
parmetros para generar las estimaciones de los parmetros, los errores tpicos, las pruebas t, los
353
MLG Anlisis univariante
intervalos de confianza y la potencia observada para cada prueba. Seleccione Matriz de coeficientes
de contraste para obtener la matriz L.
Las pruebas de homogeneidad producen la prueba de homogeneidad de varianzas de Levene
para cada variable dependiente en todas las combinaciones de nivel de los factores inter-sujetos
slo para factores inter-sujetos. Las opciones de diagramas de dispersin por nivel y grfico de
los residuos son tiles para comprobar los supuestos sobre los datos. Estos elementos no estarn
activado si no hay factores. Seleccione Grficos de los residuos para generar un grfico de los
residuos observados respecto a los pronosticados respecto a los tipificados para cada variable
dependiente. Estos grficos son tiles para investigar el supuesto de varianzas iguales. Seleccione
Falta de ajuste para comprobar si el modelo puede describir de forma adecuada la relacin entre la
variable dependiente y las variables independientes. La funcin estimable general permite construir
pruebas de hiptesis personales basadas en la funcin estimable general. Las filas en las matrices
de coeficientes de contraste son combinaciones lineales de la funcin estimable general.
Nivel de significacin. Puede que le interese corregir el nivel de significacin usado en las pruebas
post hoc y el nivel de confianza empleado para construir intervalos de confianza. El valor
especificado tambin se utiliza para calcular la potencia observada para la prueba. Si especifica
un nivel de significacin, el cuadro de dilogo mostrar el nivel asociado de los intervalos de
confianza.
Especificar contrastes de los efectos respecto a una combinacin lineal de efectos o un valor
(utilizando el subcomando TEST).
Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING).
Construir una matriz L, una matriz M o una matriz K (utilizando los subcomandos LMATRIX,
MMATRIX y KMATRIX).
Especificar trminos de error para las comparaciones post hoc (utilizando el subcomando
POSTHOC).
Calcular medias marginales estimadas para cualquier factor o interaccin entre los factores
en la lista de factores (utilizando el subcomando EMMEANS).
354
Captulo 24
Captulo
Correlaciones bivariadas
25
Para cada pareja de variables: coeficiente de correlacin de Pearson, rho de Spearman, tau-b de
Kendall, productos cruzados de las desviaciones y covarianzas.
Datos. Utilice variables cuantitativas simtricas para el coeficiente de correlacin de Pearson y
variables cuantitativas o variables con categoras ordenadas para la rho de Spearman y la tau-b
de Kendall.
Supuestos. El coeficiente de correlacin de Pearson asume que cada pareja de variables es normal
bivariada.
Para obtener correlaciones bivariadas
355
356
Captulo 25
Figura 25-1
Cuadro de dilogo Correlaciones bivariadas
nivel 0,05 se identifican por medio de un solo asterisco y los significativos al nivel 0,01
se identifican con dos asteriscos.
357
Correlaciones bivariadas
Estadsticos. Para las correlaciones de Pearson, se puede elegir una o ambas de estas opciones:
Medias y desviaciones tpicas. Se muestran para cada variable. Tambin se muestra el nmero
de casos que no tienen valores perdidos. Los valores perdidos se consideran segn cada
variable individual, sin tener en cuenta la opcin elegida para la manipulacin de los valores
perdidos.
Cada producto cruzado de las desviaciones es igual a la suma de los productos de las variables
corregidas respecto a la media. ste es el numerador del coeficiente de correlacin de Pearson.
La covarianza es una medida no tipificada de la relacin entre dos variables, igual al producto
cruzado diferencial dividido por N1.
Valores perdidos. Puede elegir uno de los siguientes:
Excluir casos segn pareja. Se excluyen del anlisis los casos con valores perdidos para una
o ambas variables de la pareja que forma un coeficiente de correlacin. Debido a que cada
coeficiente est basado en todos los casos que tienen cdigos vlidos para esa pareja concreta
de variables, en cada clculo se utiliza la mayor cantidad de informacin disponible. Esto
puede dar como resultado un grupo de coeficientes basados en un nmero de casos variable.
Excluir casos segn lista. Se excluyen de todas las correlaciones los casos con valores
Escribir una matriz de correlaciones para correlaciones de Pearson que pueda ser utilizada en
lugar de los datos brutos, con el fin de obtener otros anlisis como el anlisis factorial (con
el subcomando MATRIX).
Obtener correlaciones de todas las variables de una lista con todas las variables de una segunda
lista (utilizando la palabra clave WITH en el subcomando VARIABLES).
358
Captulo 25
Captulo
Correlaciones parciales
26
cabe esperar que dicha relacin sea negativa, un estudio describe una correlacin positiva
significativa: si la financiacin sanitaria aumenta, las tasas de enfermedad parecen disminuir.
Sin embargo, si se controla la tasa de visitas de visitadores mdicos, se elimina prcticamente
la correlacin positiva observada. La financiacin sanitaria y las tasas de enfermedad slo
parecen estar relacionadas positivamente debido a que ms personas tienen acceso a la sanidad
si la financiacin aumenta, lo que tiene como resultado que los mdicos y hospitales informen
de ms enfermedades.
Estadsticos. Para cada variable: nmero de casos sin valores perdidos, desviacin tpica y media.
Matrices de correlacin de orden cero y parcial, con grados de libertad y niveles de significacin.
Datos. Utilice variables cuantitativas y simtricas.
Supuestos. El procedimiento Correlaciones parciales supone que cada par de variables es normal
bivariante.
Para obtener correlaciones parciales
E En los mens, seleccione:
Analizar
Correlaciones
Parciales...
359
360
Captulo 26
Figura 26-1
Cuadro de dilogo Correlaciones parciales
E Seleccione dos o ms variables numricas para las que se van a calcular las correlaciones parciales.
E Elija una o ms variables numricas de control.
Mostrar el nivel de significacin real. Por defecto, se muestran la probabilidad y los grados
361
Correlaciones parciales
Medias y desviaciones tpicas. Se muestran para cada variable. Tambin se muestra el nmero
Correlaciones de orden cero. Se muestra una matriz de las correlaciones simples entre todas las
Excluir casos segn lista. Se excluyen de todos los clculos los casos que presenten valores
Excluir casos segn pareja. Para el clculo de las correlaciones de orden cero, en las que se
basan las correlaciones parciales, no se utilizar un caso si tiene valores perdidos en una o
ambas variables de un par. La eliminacin segn pareja aprovecha el mximo de los datos que
sean posibles. Sin embargo, el nmero de casos puede variar de unos coeficientes a otros.
Cuando se activa esta opcin, los grados de libertad para un coeficiente parcial determinado se
basan en el nmero menor de casos utilizado en el clculo de cualquiera de las correlaciones
de orden cero necesarias para el clculo de dicho coeficiente parcial.
Leer una matriz de correlaciones de orden cero o escribir una matriz de correlaciones parciales
(mediante el subcomando MATRIX).
Obtener correlaciones parciales entre dos listas de variables (mediante la palabra clave WITH
en el subcomando VARIABLES).
Especificar otros valores para solicitar (por ejemplo, las correlaciones parciales tanto de primer
como de segundo orden) cuando tiene dos variables de control (mediante el subcomando
VARIABLES).
Captulo
27
Distancias
Este procedimiento calcula una variedad de estadsticos que miden las similitudes o diferencias
(distancias), entre pares de variables o entre pares de casos. Estas medidas de similitud o
distancia se pueden utilizar despus con otros procedimientos, como anlisis factorial, anlisis
de conglomerados o escalamiento multidimensional, para ayudar en el anlisis de conjuntos
de datos complejos.
Ejemplo. Es posible medir similaridades entre pares de automviles en funcin de ciertas
caractersticas, como tipo de motor, consumo y potencia? Al calcular las similitudes entre los
coches, se puede obtener una nocin de qu coches son similares entre s y cules son diferentes.
Para un anlisis ms formal, puede considerar la aplicacin de un anlisis de conglomeracin
jerrquico o escalamiento multidimensional a las similitudes para explorar la estructura
subyacente.
Estadsticos. Las medidas de diferencia (distancia) para datos de un intervalo son Distancia
362
363
Distancias
Figura 27-1
Cuadro de dilogo Distancias
E Seleccione al menos una variable numrica para calcular distancias entre casos o seleccione al
o entre variables.
364
Captulo 27
En el grupo Medida, seleccione la alternativa que corresponda al tipo de datos (intervalo, recuento
o binario); a continuacin, de la lista desplegable, seleccione una las medidas que corresponda a
dicho tipo de datos. Las medidas disponibles, por tipo de dato, son:
Minkowski o Personalizada.
365
Distancias
Datos binarios. Russel y Rao, Concordancia simple, Jaccard, Dice, Rogers y Tanimoto,
366
Captulo 27
Especificar cualquier nmero entero como la potencia y la raz para una medida de distancia
personalizada.
Captulo
28
Regresin lineal
La regresin lineal estima los coeficientes de la ecuacin lineal, con una o ms variables
independientes, que mejor prediga el valor de la variable dependiente. Por ejemplo, puede intentar
predecir el total de ventas anuales de un vendedor (la variable dependiente) a partir de variables
independientes tales como la edad, la formacin y los aos de experiencia.
Ejemplo. Estn relacionados el nmero de partidos ganados por un equipo de baloncesto en una
temporada con la media de puntos que el equipo marca por partido? Un diagrama de dispersin
indica que estas variables estn relacionadas linealmente. El nmero de partidos ganados y la
media de puntos marcados por el equipo adversario tambin estn relacionados linealmente. Estas
variables tienen una relacin negativa. A medida que el nmero de partidos ganados aumenta,
la media de puntos marcados por el equipo adversario disminuye. Con la regresin lineal es
posible modelar la relacin entre estas variables. Puede utilizarse un buen modelo para predecir
cuntos partidos ganarn los equipos.
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin tpica. Para
cada modelo: coeficientes de regresin, matriz de correlaciones, correlaciones parciales y
semiparciales, R multiple, Rcuadrado, Rcuadrado corregida, cambio en Rcuadrado, error tpico de la
estimacin, tabla de anlisis de varianza, valores pronosticados y residuos. Adems, intervalos de
confianza al 95% para cada coeficiente de regresin, matriz de varianzas-covarianzas, factor de
inflacin de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis,
Cook y valores de influencia), DfBeta, DfAjuste, intervalos de pronstico y diagnsticos por caso.
Grficos: diagramas de dispersin, grficos parciales, histogramas y grficos de probabilidad
normal.
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables
debe ser normal. La varianza de distribucin de la variable dependiente debe ser constante para
todos los valores de la variable independiente. La relacin entre la variable dependiente y cada
variable independiente debe ser lineal y todas las observaciones deben ser independientes.
Para obtener un anlisis de regresin lineal
E Elija en los mens:
Analizar
Regresin
Lineal...
367
368
Captulo 28
Figura 28-1
Cuadro de dilogo Regresin lineal
Si lo desea, puede:
Elegir una variable de seleccin para limitar el anlisis a un subconjunto de casos que tengan
valores particulares para esta variable.
Seleccionar una variable de identificacin de casos para identificar los puntos en los diagramas.
Seleccione una variable numrica de Ponderacin MCP para el anlisis de mnimos cuadrados
ponderados.
MCP. Permite obtener un modelo de mnimos cuadrados ponderados. Los puntos de los datos se
ponderan por los inversos de sus varianzas. Esto significa que las observaciones con varianzas
grandes tienen menor impacto en el anlisis que las observaciones asociadas a varianzas pequeas.
Si el valor de la variable de ponderacin es cero, negativo o perdido, el caso queda excluido
del anlisis.
369
Regresin lineal
las variables en la ecuacin y despus se van excluyendo una tras otra. Aquella variable
que tenga la menor correlacin parcial con la variable dependiente ser la primera en ser
considerada para su exclusin. Si satisface el criterio de eliminacin, se eliminar. Tras
haber excluido la primera variable, se pondr a prueba aquella variable, de las que queden en
la ecuacin, que presente una correlacin parcial ms pequea. El procedimiento termina
cuando ya no quedan en la ecuacin variables que satisfagan el criterio de exclusin.
Seleccin hacia adelante. Procedimiento de seleccin de variables por pasos en el que las
370
Captulo 28
Los casos definidos por la regla de seleccin se incluyen en el anlisis. Por ejemplo, si selecciona
una variable, elija igual que y escriba 5 para el valor; de este modo, solamente se incluirn en el
anlisis los casos para los cuales la variable seleccionada tenga un valor igual a 5. Tambin se
permite un valor de cadena.
Los grficos pueden ayudar a validar los supuestos de normalidad, linealidad e igualdad de las
varianzas. Tambin son tiles para detectar valores atpicos, observaciones poco usuales y casos
de influencia. Tras guardarlos como nuevas variables, dispondr en el Editor de datos de los
valores pronosticados, los residuos y otros valores diagnsticos, con los cuales podr poder crear
grficos respecto a las variables independientes. Se encuentran disponibles los siguientes grficos:
Diagramas de dispersin. Puede representar cualquier combinacin por parejas de la lista siguiente:
la variable dependiente, los valores pronosticados tipificados, los residuos tipificados, los residuos
eliminados, los valores pronosticados corregidos, los residuos estudentizados o los residuos
eliminados estudentizados. Represente los residuos tipificados frente a los valores pronosticados
tipificados para contrastar la linealidad y la igualdad de las varianzas.
371
Regresin lineal
Lista de variables de origen. Muestra una lista con la variable dependiente (DEPENDNT) y las
cada variable independiente y los residuos de la variable dependiente cuando se regresan ambas
variables por separado sobre las restantes variables independientes. En la ecuacin debe haber al
menos dos variables independientes para que se generen los grficos parciales.
Grficos de residuos tipificados. Puede obtener histogramas de los residuos tipificados y grficos de
probabilidad normal que comparen la distribucin de los residuos tipificados con una distribucin
normal.
Si se solicita cualquier grfico, se muestran los estadsticos de resumen para los valores
pronosticados tipificados y los residuos tipificados (*ZPRED y *ZRESID).
372
Captulo 28
Puede guardar los valores pronosticados, los residuos y otros estadsticos tiles para los
diagnsticos. Cada seleccin aade una o ms variables nuevas a su archivo de datos activo.
Valores pronosticados. Son los valores que el modelo de regresin pronostica para cada caso.
Corregidos. Valor pronosticado para un caso cuando dicho caso no se incluye en los clculos
E.T. del pronstico promedio. Error tpico de los valores pronosticados. Estimacin de la
desviacin tpica del valor promedio de la variable dependiente para los casos que tengan los
mismos valores en las variables independientes.
Distancias. Son medidas para identificar casos con combinaciones poco usuales de valores para
las variables independientes y casos que puedan tener un gran impacto en el modelo.
Mahalanobis. Medida de cunto difieren del promedio para todos los casos los valores en las
De Cook. Una medida de cunto cambiaran los residuos de todos los casos si un caso
particular se excluyera del clculo de los coeficientes de regresin. Una Distancia de Cook
grande indica que la exclusin de ese caso del clculo de los estadsticos de regresin har
variar substancialmente los coeficientes.
y promedio.
Individual. Lmites superior e inferior (dos variables) del intervalo de prediccin para la
confianza para los dos intervalos de prediccin. Debe seleccionar Media o Individuos antes de
introducir este valor. Los valores habituales de los intervalos de confianza son 90, 95 y 99.
Residuos. El valor actual de la variable dependiente menos el valor pronosticado por la ecuacin
de regresin.
Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados,
que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen
una media de 0 y una desviacin tpica de 1.
Mtodo de Student. Residuo dividido por una estimacin de su desviacin tpica que vara
de caso en caso, dependiendo de la distancia de los valores de cada caso en las variables
independientes respecto a las medias en las variables independientes.
373
Regresin lineal
Eliminados. Residuo para un caso cuando ste se excluye del clculo de los coeficientes de
Eliminados estudentizados. Residuo eliminado para un caso dividido por su error tpico. La
regresin que resulta de la exclusin de un caso particular. Se calcula un valor para cada
trmino del modelo, incluyendo la constante.
coeficiente de regresin cuando se elimina del anlisis un caso particular. Puede interesarle
examinar aquellos casos cuyos valores absolutos sean mayores que 2 dividido por la raz
cuadrada de N, donde N es el nmero de casos. Se calcula un valor para cada trmino del
modelo, incluyendo la constante.
Razn entre covarianzas. Razn del determinante de la matriz de covarianza con un caso
en un archivo de datos. Los conjuntos de datos estn disponibles para su uso posterior durante la
misma sesin, pero no se guardarn como archivos a menos que se hayan guardado explcitamente
antes de que finalice la sesin. El nombre de un conjunto de datos debe cumplir las normas de
denominacin de variables. Si desea obtener ms informacin, consulte Nombres de variable en
Captulo 5 el p. 79.
Exportar informacin del modelo a un archivo XML. Las estimaciones de los parmetros y (si lo
desea) sus covarianzas se exportan al archivo especificado en formato XML (PMML). SmartScore
y SPSS Statistics Server (un producto independiente) pueden utilizar este archivo del modelo para
aplicar la informacin del modelo en otros archivos de datos con fines de puntuacin.
374
Captulo 28
variable independiente. Si es grande el cambio en Rcuadrado asociado a una variable, esto significa
que esa variable es un buen predictor de la variable dependiente.
Descriptivos. Proporciona el nmero de casos vlidos, la media y la desviacin tpica para cada
variable en el anlisis. Tambin muestra una matriz de correlaciones con el nivel de significacin
unilateral y el nmero de casos para cada correlacin.
Correlacin parcial. La correlacin remanente entre dos variables despus de haber eliminado la
correlacin debida a su asociacin mutua con otras variables. La correlacin entre una variable
dependiente y una variable independiente cuando se han eliminado de ambas los efectos lineales
de las otras variables independientes del modelo.
Correlacin semiparcial. La correlacin entre la variable dependiente y una variable independiente
cuando se han eliminado de la variable independiente los efectos lineales de las otras variables
independientes del modelo. Est relacionada con el cambio en R cuadrado cuando una variable se
aade a una ecuacin. En ocasiones e denomina correlacin semiparcial.
375
Regresin lineal
la que una de las variables independientes es una funcin lineal de otras variables independientes.
Muestra los autovalores de la matriz de productos cruzados no centrada y escalada, los ndices
de condicin y las proporciones de la descomposicin de la varianza junto con los factores de
inflacin de la varianza (FIV) y las tolerancias para las variables individuales.
Residuos. Presenta la prueba de Durbin-Watson sobre la correlacin serial de los residuos y los
diagnsticos por casos para los casos que cumplan el criterio de seleccin (los valores atpicos por
encima de n desviaciones tpicas).
seleccin de variables hacia adelante, hacia atrs o por pasos. Las variables se pueden introducir o
eliminar del modelo dependiendo de la significacin (probabilidad) del valor de F o del propio
valor de F.
Usar valor de F. Una variable se introduce en el modelo si su valor de F es mayor que el valor
de entrada, y se elimina si su valor de F es menor que el valor de salida. La entrada debe ser
mayor que la salida y ambos valores deben ser positivos. Para introducir ms variables en
el modelo, disminuya el valor de entrada. Para eliminar ms variables del modelo, eleve el
valor de salida.
376
Captulo 28
constante. Si se anula la seleccin de esta opcin se obtiene la regresin que pasan por el origen,
lo cual se hace raramente. Algunos resultados de la regresin que pasan por el origen no son
comparables con los resultados de la regresin que s incluyen una constante. Por ejemplo,
Rcuadrado no puede interpretarse de la manera usual.
Valores perdidos. Puede elegir uno de los siguientes:
Excluir casos segn lista. Slo se incluirn en el anlisis los casos con valores vlidos para
Excluir casos segn pareja. Los casos con datos completos para la pareja de variables
Reemplazar por la media. Se emplean todos los casos en los clculos, sustituyendo las
Escribir una matriz de correlaciones o leer una matriz (en lugar de los datos brutos) con el fin
de obtener el anlisis de regresin (mediante el subcomando MATRIX).
Obtener mltiples modelos para las mismas variables dependientes u otras diferentes
(mediante los subcomandos METHOD y DEPENDENT).
Captulo
29
Regresin ordinal
La regresin ordinal permite dar forma a la dependencia de una respuesta ordinal politmica sobre
un conjunto de predictores, que pueden ser factores o covariables. El diseo de la regresin
ordinal se basa en la metodologa de McCullagh (1980, 1998) y en la sintaxis se hace referencia al
procedimiento como PLUM.
El anlisis de regresin lineal ordinario implica minimizar las diferencias de la suma de los
cuadrados entre una variable de respuesta (la dependiente) y una combinacin ponderada de las
variables predictoras (las independientes). Los coeficientes estimados reflejan cmo los cambios
en los predictores afectan a la respuesta. Se considera que la respuesta es numrica, en el sentido
en que los cambios en el nivel de la respuesta son equivalentes en todo el rango de la respuesta.
Por ejemplo, la diferencia de altura entre una persona que mide 150 cm y una que mide 140 cm
es de 10 cm, que tiene el mismo significado que la diferencia de altura entre una persona que
mide 210 cm y una que mide 200 cm. Estas relaciones no se mantienen necesariamente con las
variables ordinales, en las que la eleccin y el nmero de categoras de respuesta pueden ser
bastante arbitrarios.
Ejemplo. La regresin ordinal podra utilizarse para estudiar la reaccin de los pacientes con
respecto a una dosis de un frmaco. Las reacciones posibles podran clasificarse como ninguna,
ligera, moderada o grave. La diferencia entre una reaccin ligera y una moderada es difcil o
imposible de cuantificar y se basa en la apreciacin. Adems, la diferencia entre una respuesta
ligera y una moderada podra ser superior o inferior a la diferencia entre una respuesta moderada y
una grave.
Estadsticos y grficos. Frecuencias observadas y esperadas y frecuencias acumuladas, residuos de
Pearson para las frecuencias y las frecuencias acumuladas, probabilidades observadas y esperadas,
probabilidades acumuladas observadas y esperadas para cada categora de respuesta por patrn en
las covariables, matrices de correlaciones asintticas y de covarianzas entre las estimaciones de los
parmetros, chi-cuadrado de Pearson y chi-cuadrado de la razn de verosimilitud, estadsticos de
bondad de ajuste, historial de iteraciones, contraste del supuesto de lneas paralelas, estimaciones
de los parmetros, errores tpicos, intervalos de confianza y estadsticos R2 de Cox y Snell, de
Nagelkerke y de McFadden.
Datos. Se asume que la variable dependiente es ordinal y puede ser numrica o de cadena. El
patrn distinto de valores en las variables independientes, se supone que las respuestas son
variables multinomiales independientes.
377
378
Captulo 29
Procedimientos relacionados. La regresin logstica nominal utiliza modelos similares para las
variables dependientes nominales.
Obtener una regresin ordinal
E En los mens, seleccione:
Analizar
Regresin
Ordinal...
Figura 29-1
Cuadro de dilogo Regresin ordinal
379
Regresin ordinal
Figura 29-2
Cuadro de dilogo Regresin ordinal: Opciones
en cada una de las estimaciones de los parmetros es inferior a este valor. Si se especifica
0, no se utiliza el criterio.
Intervalo de confianza. Especifique un valor mayor o igual a 0 e inferior a 100.
Delta. El valor aadido a las frecuencias de casilla de cero. Especifique un valor no negativo
inferior a 1.
Tolerancia para la singularidad. Utilizada para comprobar los predictores con alta dependencia.
que permiten la estimacin del modelo. Existen cinco funciones de enlace que se resumen en la
siguiente tabla.
Funcin
Frmula
Aplicacin tpica
Logit
log( / (1) )
Log-log complementario
log(log(1))
Log-log negativo
log(log())
380
Captulo 29
Funcin
Frmula
Aplicacin tpica
Probit
1()
tan((0,5))
confianza.
Correlacin asinttica de las estimaciones de los parmetros. Matriz de las correlaciones entre
Covarianza asinttica de las estimaciones de los parmetros. Matriz de las covarianzas entre las
381
Regresin ordinal
de covariables (por ejemplo, modelos con covariables continuas), esta opcin puede generar
una tabla grande y poco manejable.
ubicacin son equivalentes en todos los niveles de la variable dependiente. Esta prueba est
disponible nicamente para el modelo de slo ubicacin.
Variables guardadas. Guarda las siguientes variables en el archivo de trabajo:
patrn de factor/covariable.
con los productos que no incluyan la constante, puede seleccionar la opcin de excluirla.
382
Captulo 29
Especificar modelo. Un modelo de efectos principales contiene los efectos principales de las
covariables y los factores, pero no contiene efectos de interaccin. Puede crear un modelo
personalizado para especificar subconjuntos de interacciones entre los factores o bien interacciones
entre las covariables.
Factores y covariables. Muestra una lista de los factores y las covariables.
Modelo de ubicacin. El modelo depende de los efectos principales y de los de interaccin que
seleccione.
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
seleccione.
383
Regresin ordinal
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables seleccionadas.
Captulo
Estimacin curvilnea
30
correo electrnico infectado de virus en la red a lo largo del tiempo. Un diagrama de dispersin
revela que la relacin es no lineal. Se puede ajustar un modelo lineal a los datos y comprobar
la validez de los supuestos y la bondad de ajuste del modelo.
Estadsticos. Para cada modelo: coeficientes de regresin, R mltiple, Rcuadrado, Rcuadrado
384
385
Estimacin curvilnea
Figura 30-1
Cuadro de dilogo Estimacin curvilnea
E Seleccione una o ms variables dependientes. Se produce un modelo diferente para cada variable
dependiente.
E Seleccione una variable independiente (seleccione una variable del conjunto de datos activo
o Tiempo).
E Si lo desea:
Seleccionar una variable para etiquetar los casos en los diagramas de dispersin. Para cada
punto en el diagrama de dispersin, se puede utilizar la herramienta de Identificacin de
puntos para mostrar el valor de la variable utilizada en Etiquetas de caso.
Pulsar en Guardar para guardar los valores pronosticados, los residuos y los intervalos de
pronstico como nuevas variables.
Representar los modelos. Representa los valores de la variable dependiente y cada modelo
Ver tabla de ANOVA. Muestra una tabla de anlisis de varianza de resumen para cada modelo
seleccionado.
386
Captulo 30
387
Estimacin curvilnea
Guardar variables. Para cada modelo seleccionado se pueden guardar los valores pronosticados, los
residuos (el valor observado de la variable dependiente menos el valor pronosticado por el modelo)
y los intervalos de pronstico (sus lmites superior e inferior). En la ventana de resultados, se
muestran en una tabla los nombres de las nuevas variables y las etiquetas descriptivas.
Pronosticar casos. En el conjunto de datos activo, si se selecciona Tiempo como variable
independiente en lugar de una variable, se puede especificar un perodo de prediccin que vaya
ms all del final de la serie temporal. Puede elegir una de las siguientes alternativas:
Desde el perodo de estimacin hasta el ltimo caso. Pronostica los valores para todos los casos
del archivo, basndose en los casos del perodo de estimacin. El perodo de estimacin, que
se muestra en la parte inferior del cuadro de dilogo, se define con el subcuadro de dilogo
Rango de la opcin Seleccionar casos en el men Datos. Si no se ha definido un perodo de
estimacin, se utilizan todos los casos para pronosticar los valores.
Predecir hasta. Predice los valores hasta la fecha especificada, hora o nmero de observacin,
basndose en los casos del perodo de estimacin. Esta caracterstica se puede utilizar
para predecir valores ms all del ltimo caso de la serie temporal. Las variables definidas
actualmente determinan los cuadros de texto disponibles para especificar el final del perodo
de prediccin. Si no existen variables de fecha definidas, se puede especificar el nmero de la
observacin (caso) final.
Utilice la opcin de Definir fechas en el men Datos para crear las variables de fecha.
Captulo
31
Python se haya instalado en el sistema donde se vaya a ejecutar PLS. El mdulo de extensin PLS
se debe instalar por separado y el instalador se puede descargar de http://www.spss.com/devcentral.
Nota: El mdulo de extensin PLS depende del software Python. SPSS Inc. no es el propietario ni
el licenciatario del software Python. Cualquier usuario de Python debe aceptar las condiciones del
acuerdo de licencia de Python que se encuentra en el sitio Web de Python. SPSS Inc. no realiza
ninguna afirmacin sobre la calidad del programa Python. SPSS Inc. rechaza completamente
todas las responsabilidades asociadas al uso del programa Python.
Tablas. La proporcin de la varianza explicada (por factor latente), las ponderaciones y las
ponderaciones factoriales de los tres primeros factores latentes y la distancia al modelo se generan
desde la pestaa Opciones.
Nivel de medida. Las variables (predictoras) dependientes e independientes pueden ser de escala,
388
389
Regresin de mnimos cuadrados parciales
cercano antes de utilizarlos. Los casos con ponderaciones perdidas o ponderaciones inferiores a
0,5 no se emplearn en los anlisis.
Valores perdidos. Los valores definidos como perdidos por el usuario o el sistema se consideran
no vlidos.
Cambio de escala. Todas las variables del modelo se centran y tipifican, incluidas las variables
390
Captulo 31
E Seleccione al menos una variable dependiente.
E Seleccione al menos una variable independiente.
Si lo desea, puede:
Especificar una categora de referencia para las variables dependientes categricas (nominales
u ordinales).
Especificar la variable que se utilizar como identificador nico para los resultados por casos y
los conjuntos de datos guardados.
Modelo
Figura 31-2
Regresin de mnimos cuadrados parciales, pestaa Modelo
Especificar efectos del modelo. El modelo de efectos principales contiene todos los efectos
principales de los factores y de las covariables. Seleccione Personalizado para especificar las
interacciones. Indique todos los trminos que desee incluir en el modelo.
Factores y Covariables.Muestra una lista de los factores y las covariables.
Modelo. El modelo depende de la naturaleza de los datos. Despus de seleccionar Personalizado,
puede elegir los efectos principales y las interacciones que sean de inters para el anlisis.
391
Regresin de mnimos cuadrados parciales
Construir trminos
Opciones
Figura 31-3
Regresin de mnimos cuadrados parciales, pestaa Opciones
La pestaa Opciones permite al usuario guardar y representar las estimaciones de los modelos
para los determinados casos, factores latentes y predictores.
Para cada tipo de datos, especifique el nombre del conjunto de datos. Los nombres de los
conjuntos de datos deben ser nicos. Si introduce el nombre de un conjunto de datos ya existente,
se reemplazarn los contenidos. En otro caso, se crear un nuevo conjunto de datos.
392
Captulo 31
Guardar estimaciones para casos individuales. Guarda las siguientes estimaciones de modelos
por casos: valores pronosticados, residuos, distancia respecto al modelo del factor latente y
puntuaciones de los factores latentes. Tambin representa las puntuaciones de los factores
latentes.
Guardar estimaciones para factores latentes. Guarda las saturaciones y las ponderaciones de
Guardar estimaciones para variables independientes. Guarda las estimaciones de los parmetros
Captulo
32
El mtodo Anlisis de vecinos ms prximos tambin puede utilizarse para calcular valores para
un destino continuo. En esta situacin, se calcula la media de los valores de los vecinos ms
prximos del destino para obtener un valor para el nuevo caso.
Objetivo y funciones. El objetivo y las funciones pueden ser:
Nominal. Una variable se puede tratar como nominal si sus valores representan categoras que
394
Captulo 32
Ordinal. Una variable puede tratarse como ordinal cuando sus valores representan categoras
con alguna ordenacin intrnseca (por ejemplo, los niveles de satisfaccin con un servicio,
que vayan desde muy insatisfecho hasta muy satisfecho). Entre los ejemplos de variables
ordinales se incluyen escalas de actitud que representan el grado de satisfaccin o confianza y
las puntuaciones de evaluacin de las preferencias.
Escala. Una variable puede ser tratada como escala cuando sus valores representan categoras
ordenadas con una mtrica con significado, por lo que son adecuadas las comparaciones de
distancia entre valores. Son ejemplos de variables de escala: la edad en aos y los ingresos
en dlares.
El anlisis de vecinos ms prximos trata por igual las variables nominales u ordinales. El
procedimiento supone que se ha asignado el nivel de medida adecuado a cada variable. No
obstante, puede cambiar temporalmente el nivel de medida para una variable pulsando con
el botn derecho en la variable en la lista de variables de origen y seleccionar un nivel de
medida en el men contextual. Para modificar permanentemente el nivel de medicin de una
variable, consulte Nivel de medida de variable.
Un icono situado junto a cada variable de la lista de variables identifica el nivel de medida y
el tipo de datos.
Nivel de medida
Tipo de datos
Numrico
Escala
Cadena
Fecha
Tiempo
n/a
Ordinal
Nominal
395
Anlisis de vecinos ms prximos
Cambio de escala. Las funciones de escala se normalizan por defecto. Todo cambio de
escala se realiza basndose en los datos de entrenamiento, incluso si se define una muestra
reservada (consulte Particiones el p. 400). Si especifica una variable para definir particiones, es
importante que las funciones tengan distribuciones similares en todas las muestras reservadas, de
entrenamiento o comprobacin. Utilice por ejemplo, Explorar para examinar las distribuciones en
las particiones.
Ponderaciones de frecuencia. Este procedimiento ignora las ponderaciones de frecuencia.
Replicacin de los resultados. El procedimiento utiliza la generacin de nmeros aleatorios
396
Captulo 32
E Especifique una o ms funciones que puedan constituir variables independientes o predictores en
ejemplo, un investigador desea determinar si las puntuaciones de las pruebas de un distrito escolar
(el caso focal) son comparables con las distritos escolares similares. Utiliza un anlisis de vecinos
ms prximos para encontrar los distritos escolares ms parecidos con respecto a un conjunto
dado de funciones. Despus compara las puntuaciones de las pruebas del distrito escolar focal
con las de los vecinos ms prximos.
Los casos focales tambin deben emplearse en estudios clnicos para seleccionar casos de
control similares a los casos clnicos. Los casos focales se muestran en la tabla de k vecinos
ms prximos y distancias, el grfico de espacio de funciones, el grfico de homlogos y el
mapa de cuadrantes. La informacin sobre casos focales se guarda en los archivos especificados
en la pestaa Resultados.
Los casos con un valor positivo en la variable especificada se tratan como casos focales. No es
posible especificar una variable sin valores positivos.
Etiqueta de caso (opcional). Los casos se etiquetan utilizando estos valores en el grfico de espacio
397
Anlisis de vecinos ms prximos
Vecinos
Figura 32-3
Anlisis de vecinos ms prximos: pestaa Vecinos
cuenta que el uso de un nmero mayor de vecinos no implica que el modelo resultante sea ms
preciso.
Si se especifica un destino en la pestaa Variables, puede especificar un rango de valores y
permitir que el procedimiento seleccione el mejor nmero de vecinos de ese rango. El mtodo
para determinar el nmero de vecinos ms prximos depende de si se solicita la seleccin de
funciones en la pestaa Funciones.
Si la seleccin de funciones est activada, sta se realizar para cada valor de k en el rango
solicitado, y se seleccionar la k y el conjunto de funciones compaero con la menor tasa de
error (o el menor error cuadrtico si el destino es escala).
398
Captulo 32
Mtrica eucldea. La distancia entre dos casos, x e y, es la raz cuadrada de la suma, sobre
todas las dimensiones, de las diferencias cuadradas entre los valores de esos casos.
Mtrica de bloques de ciudad. La distancia entre dos casos es la suma, en todas las
dimensiones, de las diferencias absolutas entre los valores de esos casos. Tambin se conoce
como la distancia de Manhattan.
Adems, si se especifica un destino en la pestaa Variables, puede optar por ponderar funciones
segn su importancia normalizada a la hora de calcular distancias. La importancia que una
funcin tiene para un predictor se calcula en funcin de la relacin entre la tasa de error o errores
cuadrticos del modelo sin el predictor y la tasa de error o errores cuadrticos del modelo
completo. La importancia normalizada se calcula volviendo a ponderar los valores de importancia
de la funcin para que sumen 1.
Predicciones del destino de escala. Si se especifica un destino de escala en la pestaa Variables,
especificar si el valor predicho se calcula en funcin de la media o del valor medio de los vecinos
ms prximos.
Funciones
Figura 32-4
Anlisis de vecinos ms prximos: pestaa Funciones
399
Anlisis de vecinos ms prximos
tasa de errores absolutos indica que el modelo no puede mejorarse ms aadiendo nuevas
funciones. Especifique un nmero positivo. Si se reducen los valores del cambio mnimo
se incluirn ms funciones, pero puede que se incluyan funciones que no aadan gran valor
al modelo. Si se aumentan los valores del cambio mnimo se excluirn ms funciones, pero
puede que se pierdan funciones importantes para el modelo. El valor ptimo de cambio
mnimo depender de sus datos y de la aplicacin. Consulte el Registro de errores de seleccin
de funciones en los resultados para poder evaluar qu funciones son ms importantes. Si desea
obtener ms informacin, consulte Registro de errores de seleccin de funciones el p. 411.
400
Captulo 32
Particiones
Figura 32-5
Anlisis de vecinos ms prximos: pestaa Particiones
Utilizar variable para asignar los casos. Especifique una variable numrica que asigne cada
caso del conjunto de datos activo a la muestra de entrenamiento o reserva. Los casos con un
valor positivo de la variable se asignarn a la muestra de entrenamiento, los casos con un
valor 0 o negativo se asignarn a la muestra de reserva. Los casos con un valor perdido del
401
Anlisis de vecinos ms prximos
sistema se excluirn del anlisis. Todos los valores perdidos de usuario de la variable de
particin se tratarn siempre como vlidos.
Pliegues de validacin cruzada. La validacin cruzada de pliegue en V se utiliza para determinar el
mejor nmero de vecinos. Por razones de rendimiento, no est disponible con la seleccin de
funciones.
La validacin cruzada divide la muestra en un nmero de submuestras o pliegues. A continuacin,
se generan los modelos de vecino ms prximo, que no incluyen los datos de cada submuestra.
El primer modelo se basa en todos los casos excepto los correspondientes al primer pliegue de
la muestra; el segundo modelo se basa en todos los casos excepto los del segundo pliegue de la
muestra y as sucesivamente. Para cada modelo se calcula el error aplicando el modelo a la
submuestra que se excluy al generarse este. El mejor nmero de vecinos ms prximos ser el
que produzca el menor error entre los pliegues.
Utilizar variable para asignar los casos. Especifique una variable numrica que asigne cada
caso del conjunto de datos activo a un pliegue. La variable debe ser numrica y tomar valores
de 1 a V. Si cualquier valor de este rango falta y se encuentran en una divisin (si hay archivos
de divisin activos), se producir un error. Si desea obtener ms informacin, consulte
Segmentar archivo en Captulo 9 el p. 194.
Definir semilla para tornado de Mersenne. Si se establece una semilla es posible replicar anlisis.
Este control es bsicamente un mtodo abreviado para definir el tornado de Mersenne como el
generador activo y para especificar un punto de inicio fijo en el cuadro de dilogo Generadores
de nmeros aleatorios. Si desea obtener ms informacin, consulte Generadores de nmeros
aleatorios en Captulo 8 el p. 140.
402
Captulo 32
Guardado
Figura 32-6
Anlisis de vecinos ms prximos: pestaa Guardar
Nombres de las variables guardadas. La generacin automtica de nombres garantiza que conserva
todo su trabajo. Los nombres personalizados le permiten descartar/reemplazar los resultados de
las ejecuciones anteriores sin eliminar antes las variables guardadas en el Editor de datos.
Variables a guardar
Valor o categora pronosticados. Esta opcin guarda el valor pronosticado para el destino de
Probabilidad pronosticada. Esta opcin guarda las probabilidades pronosticadas para un destino
categrico. Para cada una de las primeras n categoras se guarda una variable diferente, donde
n se especifica en el control Mximo de categoras para guardar para un destino categrico.
las muestras de entrenamiento y reserva de la pestaa Particiones, esta opcin guarda el valor
de la particin (entrenamiento y reserva) a la que se ha asignado el caso.
pliegues de validacin cruzada de la pestaa Particiones, esta opcin guarda el valor del
pliegue al que se ha asignado el caso.
403
Anlisis de vecinos ms prximos
Resultados
Figura 32-7
Anlisis de vecinos ms prximos: pestaa Resultados
Visor de resultados
casos, que resume el nmero de casos incluidos y excluidos en el anlisis, en total y por
muestras de entrenamiento y reservadas.
Grficos y tablas. Muestra los resultados relacionados con los modelos, incluyendo tablas y
grficos. Las tablas de la vista de modelo incluyen los k vecinos ms prximos y las distancias
de casos focales, la clasificacin de variables de respuesta categrica y un resumen de errores.
El resultado grfico de la vista de modelo incluye un registro de errores de seleccin, un grfico
de importancia de funciones, un grfico de espacio de funciones, un grfico de homlogos y
un mapa de cuadrante. Si desea obtener ms informacin, consulte Vista de modelo el p. 405.
Archivos
404
Captulo 32
Exportar modelo a XML. SmartScore y SPSS Statistics Server (un producto independiente)
pueden utilizar este archivo del modelo para aplicar la informacin del modelo en otros
archivos de datos con fines de puntuacin. Esta opcin no se encuentra disponible si se
han definido archivos segmentados.
Exportar distancias entre casos focales y k vecinos ms prximos. En cada caso focal, se crea
una variable distinta para cada uno de los k vecinos ms prximos del caso focal (de la
muestra de entrenamiento) y las k distancias ms prximas correspondientes.
Opciones
Figura 32-8
Anlisis de vecinos ms prximos: pestaa Opciones
Valores definidos como perdidos por el usuario. Para que un caso se incluya en el anlisis, las
variables categricas deben tener valores vlidos para dicho caso. Estos controles permiten
decidir si los valores definidos como perdidos por el usuario se deben tratar como vlidos entre las
variables categricas.
Los valores perdidos por el sistema y perdidos para las variables de escala siempre se tratan
como no vlidos.
405
Anlisis de vecinos ms prximos
Vista de modelo
Figura 32-9
Anlisis de vecinos ms prximos: Vista de modelos
El primer panel muestra una descripcin general del modelo denominado vista principal.
Por defecto, el primer panel muestra el espacio de la funcin y el segundo muestra el grfico de
importancia de variables. Si el grfico de importancia de variables no est disponible, es decir, si
Ponderar funciones por importancia no se ha seleccionado en la pestaa Funciones, se mostrar la
primera vista disponible en la lista desplegable Ver.
406
Captulo 32
Figura 32-10
Anlisis de vecinos ms prximos: lista desplegable Ver
Cuando una vista no tiene ninguna informacin disponible, se desactiva este texto de elemento
en la lista desplegable Ver.
Si desea obtener ms informacin sobre los objetos Modelo, consulte Modelos el p. 267.
Espacio de funciones
Figura 32-11
Espacio de funciones
407
Anlisis de vecinos ms prximos
El color y el sombreado de un punto indican el valor del destino de ese caso: cada valor de
color diferente representa las categoras de un destino categrico y las sombras indican el
rango de valores de un destino continuo. El valor indicado para la particin de entrenamiento
es el valor observado, mientras que en el caso de la particin de reserva, representa el valor
pronosticado. Si no se especifica ningn destino, esta clave no aparece.
Los titulares ms gruesos indican que un caso es focal. Los casos focales se muestran en
relacin con sus k vecinos ms prximos.
Controles e interactividad. Una aserie de controles del grfico le permite explorar el espacio de
funciones.
Puede modificar el nmero de vecinos ms prximos (k) para mostrar casos focales.
Al pasar el ratn sobre un punto del grfico se mostrar una sugerencia con el valor de la
etiqueta de caso o un nmero de caso si las etiquetas de caso no se definen, as como los
valores de destino observados y pronosticados.
408
Captulo 32
Importancia de la variable
Figura 32-12
Importancia de la variable
409
Anlisis de vecinos ms prximos
Homlogos
Figura 32-13
Grfico de homlogos
Este grfico muestra los casos focales y sus k vecinos ms prximos en cada funcin y en el
destino. Est disponible si se selecciona un caso focal en el espacio de funciones.
Forma de enlace. El grfico Homlogos se enlaza con el espacio de funciones de dos formas.
Esta tabla muestra los k vecinos ms prximos y las distancias de casos focales nicamente. Est
disponible si se especifica un identificador de caso focal en la pestaa Variables, y slo muestra los
casos focales identificados por esta variable.
410
Captulo 32
La columna Caso focal contiene el valor de la variable de etiqueta de caso del caso focal; si las
etiquetas de caso no se definen, esta columna contendr el nmero de caso del caso focal.
Mapa de cuadrantes
Figura 32-15
Mapa de cuadrantes
Este grfico muestra los casos focales y sus k vecinos ms prximos en un diagrama de dispersin
(o grfico de puntos, dependiendo del nivel de medicin del destino) con el destino en el eje y y
una funcin de escala en el eje x, panelado por funciones. Est disponible si hay un destino y se
selecciona un caso focal en el Espacio de funciones.
Se dibujan lneas de referencia para las variables continuas en las medias variables en la
particin de entrenamiento.
411
Anlisis de vecinos ms prximos
Seala en la vista de grfico el error (la tasa de error o de error cuadrtico, dependiendo del
nivel de medicin del destino) en el eje y para el modelo con la funcin enumerada en el eje x
(adems de todas las funciones a la izquierda del eje x). Este grfico est disponible si hay un
destino y la seleccin de funciones est activada.
412
Captulo 32
Seala en la vista de grfico el error (la tasa de error o de error cuadrtico, dependiendo del nivel
de medicin del destino) en el eje y para el modelo con el nmero de vecinos ms prximos (k) en
el eje x. Este grfico est disponible si hay un destino y la seleccin de k est activada.
413
Anlisis de vecinos ms prximos
Estos son los grficos de seleccin de funciones (consulte Registro de errores de seleccin de
funciones el p. 411), panelados por k. Este grfico est disponible si hay un destino y la seleccin
de funciones y k estn activadas.
Tabla de clasificacin
Figura 32-19
Tabla de clasificacin
Esta tabla muestra la clasificacin cruzada de los valores observados en comparacin con los
valores pronosticados del destino, en funcin de la particin. Est disponible si hay un destino
y es categrico.
La fila (Perdidos) de la particin de reserva contiene casos de reserva con los valores perdidos
en el destino. Estos casos contribuyen a los valores de Muestra de reserva: Valores de
Porcentaje global, pero no a los valores de Porcentaje correcto.
414
Captulo 32
Resumen de error
Figura 32-20
Resumen de error
Esta tabla est disponible si hay una variable de destino. Muestra el error asociado con el modelo,
la suma de cuadrados de un destino continuo y la tasa de error (100% porcentaje global
correcto) de un destino categrico.
Captulo
Anlisis discriminante
33
El anlisis discriminante crea un modelo predictivo para la pertenencia al grupo. El modelo est
compuesto por una funcin discriminante (o, para ms de dos grupos, un conjunto de funciones
discriminantes) basada en combinaciones lineales de las variables predictoras que proporcionan la
mejor discriminacin posible entre los grupos. Las funciones se generan a partir de una muestra
de casos para los que se conoce el grupo de pertenencia; posteriormente, las funciones pueden
ser aplicadas a nuevos casos que dispongan de medidas para las variables predictoras pero de los
que se desconozca el grupo de pertenencia.
Nota: La variable de agrupacin puede tener ms de dos valores. Los cdigos de la variable de
agrupacin han de ser nmeros enteros y es necesario especificar sus valores mximo y mnimo.
Los casos con valores fuera de estos lmites se excluyen del anlisis.
Ejemplo. Por trmino medio, las personas de los pases de zonas templadas consumen ms caloras
por da que las de los trpicos, y una proporcin mayor de la poblacin de las zonas templadas
vive en ncleos urbanos. Un investigador desea combinar esta informacin en una funcin para
determinar cmo de bien un individuo es capaz de discriminar entre los dos grupos de pases. El
investigador considera adems que el tamao de la poblacin y la informacin econmica tambin
pueden ser importantes. El anlisis discriminante permite estimar los coeficientes de la funcin
discriminante lineal, que tiene el aspecto de la parte derecha de una ecuacin de regresin lineal
mltiple. Es decir, utilizando los coeficientes a, b, c y d, la funcin es:
Si estas variables resultan tiles para discriminar entre las dos zonas climticas, los valores de
D sern diferentes para los pases templados y para los tropicales. Si se utiliza un mtodo de
seleccin de variables por pasos, quizs no se necesite incluir las cuatro variables en la funcin.
Estadsticos. Para cada variable: medias, desviaciones tpicas, ANOVA univariado. Para cada
anlisis: M de Box, matriz de correlaciones intra-grupos, matriz de covarianzas intra-grupos,
matriz de covarianzas de los grupos separados, matriz de covarianzas total. Para cada funcin
discriminante cannica: autovalores, porcentaje de varianza, correlacin cannica, lambda de
Wilks, chi-cuadrado. Para cada paso: probabilidades previas, coeficientes de la funcin de Fisher,
coeficientes de funcin no tipificados, lambda de Wilks para cada funcin cannica.
Datos. La variable de agrupacin debe tener un nmero limitado de categoras distintas,
codificadas como nmeros enteros. Las variables independientes que sean nominales deben ser
recodificadas a variables dummy o de contraste.
415
416
Captulo 33
Supuestos. Los casos deben ser independientes. Las variables predictoras deben tener una
E Seleccione una variable de agrupacin con valores enteros y pulse en Definir rango para especificar
valores enteros, la opcin Recodificacin automtica en el men Transformar crear una variable
que los tenga).
E Seleccione el mtodo de introduccin de las variables independientes.
Usar mtodo de inclusin por pasos. Utiliza el anlisis por pasos para controlar la entrada y la
salida de variables.
E Si lo desea, seleccione casos mediante una variable de seleccin.
417
Anlisis discriminante
Especifique los valores mnimo y mximo de la variable de agrupacin para el anlisis. Los casos
con valores fuera de este rango no se utilizan en el anlisis discriminante, pero s se clasifican en
uno de los grupos existentes a partir de los resultados que obtengan en el anlisis. Los valores
mnimo y mximo deben ser nmeros enteros.
Slo se utilizan los casos con el valor especificado en la variable de seleccin para derivar las
funciones discriminantes. Tanto para los casos seleccionados como para los no seleccionados
se generan resultados de clasificaciones y estadsticos. Este proceso ofrece un mecanismo para
clasificar casos nuevos basados en datos previos o para dividir los datos en subconjuntos de
contraste y comprobacin para realizar procedimientos de validacin en el modelo generado.
418
Captulo 33
Descriptivos. Las opciones disponibles son: Medias (que incluye las desviaciones tpicas),
Medias. Muestra la media y desviacin tpica totales y las medias y desviaciones tpicas
M de Box. Contraste sobre la igualdad de las matrices de covarianza de los grupos. Para
Coeficientes no tipificados.
Matrices. Las matrices de coeficientes disponibles para las variables independientes son las de:
obtiene de promediar las matrices de covarianza individuales para todos los grupos antes de
calcular las correlaciones.
puede diferir de la matriz de covarianza total. La matriz se obtiene de promediar, para todos
los grupos, las matrices de covarianza individuales.
419
Anlisis discriminante
Covarianza de grupos separados. Muestra las matrices de covarianza de cada grupo por
separado.
Covarianza total. Muestra la matriz de covarianza para todos los casos, como si fueran una
nica muestra.
Mtodo. Seleccione el estadstico que se va a utilizar para introducir o eliminar nuevas variables.
lambda de Wilks. Mtodo para la seleccin de variables por pasos del anlisis discriminante
Distancia de Mahalanobis. Medida de cunto difieren del promedio para todos los casos los
valores en las variables independientes de un caso dado. Una distancia de Mahalanobis grande
identifica un caso que tenga valores extremos en una o ms de las variables independientes.
Menor razn F. Mtodo para la seleccin de variables en los anlisis por pasos que se basa en
V de Rao. Medida de las diferencias entre las medias de los grupos. Tambin se denomina la
420
Captulo 33
Usar valor de F. Una variable se introduce en el modelo si su valor de F es mayor que el valor
de entrada, y se elimina si su valor de F es menor que el valor de salida. La entrada debe ser
mayor que la salida y ambos valores deben ser positivos. Para introducir ms variables en
el modelo, disminuya el valor de entrada. Para eliminar ms variables del modelo, eleve el
valor de salida.
Todos los grupos iguales. Se suponen probabilidades previas iguales para todos los grupos.
Calcular segn tamaos de grupos. Los tamaos de los grupos observados de la muestra
421
Anlisis discriminante
Resultados para cada caso. Se muestran, para cada caso, los cdigos del grupo real de
Clasificacin dejando uno fuera. Se clasifica cada caso del anlisis mediante la funcin derivada
de todos los casos, excepto el propio caso. Tambin se conoce como mtodo U.
Reemplazar los valores perdidos con la media. Seleccione esta opcin para sustituir la media de una
casos.
Grupos separados. Para la clasificacin se utilizan las matrices de covarianza de los grupos
Grupos combinados. Crea un diagrama de dispersin, con todos los grupos, de los valores en
las dos primeras funciones discriminantes. Si slo hay una funcin, en su lugar se muestra
un histograma.
Grupos separados. Crea diagramas de dispersin, de los grupos por separado, para los valores
en las dos primeras funciones discriminantes. Si slo hay una funcin, en su lugar se muestra
un histograma.
Mapa territorial. Grfico de las fronteras utilizadas para clasificar los casos en grupos a
partir de los valores en las funciones. Los nmeros corresponden a los grupos en los que se
clasifican los casos. La media de cada grupo se indica mediante un asterisco situado dentro de
sus fronteras. No se mostrar el mapa si slo hay una funcin discriminante.
422
Captulo 33
Es posible aadir variables nuevas al archivo de datos activo. Las opciones disponibles son las de
grupo de pertenencia pronosticado (una nica variable), puntuaciones discriminantes (una variable
para cada funcin discriminante en la solucin) y probabilidades de pertenencia al grupo segn las
puntuaciones discriminantes (una variable para cada grupo).
Tambin se puede exportar informacin del modelo al archivo especificado en formato XML
(PMML). SmartScore y SPSS Statistics Server (un producto independiente) pueden utilizar este
archivo del modelo para aplicar la informacin del modelo en otros archivos de datos con fines
de puntuacin.
Captulo
34
Anlisis factorial
Existen cinco mtodos de rotacin disponibles, entre ellos el oblimin directo y el promax para
rotaciones no ortogonales.
Existen tres mtodos disponibles para calcular las puntuaciones factoriales; y las puntuaciones
pueden guardarse como variables para anlisis adicionales.
Ejemplo. Qu actitudes subyacentes hacen que las personas respondan a las preguntas de una
encuesta poltica de la manera en que lo hacen? Examinando las correlaciones entre los elementos
de la encuesta se deduce que hay una superposicin significativa entre los diversos subgrupos
de elementos (las preguntas sobre los impuestos tienden a estar correlacionadas entre s, las
preguntas sobre temas militares tambin estn correlacionadas entre s, y as sucesivamente).
Con el anlisis factorial, se puede investigar el nmero de factores subyacentes y, en muchos
casos, identificar lo que los factores representan conceptualmente. Adicionalmente, se pueden
calcular las puntuaciones factoriales para cada encuestado, que pueden utilizarse en anlisis
subsiguientes. Por ejemplo, es posible construir un modelo de regresin logstica para predecir el
comportamiento de voto basndose en las puntuaciones factoriales.
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin tpica. Para
cada anlisis factorial: matriz de correlaciones de variables, incluidos niveles de significacin,
determinante, inversa; matriz de correlaciones reproducida, que incluye anti-imagen; solucin
inicial (comunalidades, autovalores y porcentaje de varianza explicada); KMO (medida de la
adecuacin muestral de Kaiser-Meyer-Olkin) y prueba de esfericidad de Bartlett; solucin sin
rotar, que incluye saturaciones factoriales, comunalidades y autovalores; y solucin rotada, que
incluye la matriz de configuracin rotada y la matriz de transformacin. Para rotaciones oblicuas:
las matrices de estructura y de configuracin rotadas; matriz de coeficientes para el clculo de
las puntuaciones factoriales y matriz de covarianzas entre los factores. Grficos: grfico de
sedimentacin y grfico de las saturaciones de los dos o tres primeros factores.
423
424
Captulo 34
Datos. Las variables deben ser cuantitativas a nivel de intervalo o de razn. Los datos categricos
(como la religin o el pas de origen) no son adecuados para el anlisis factorial. Los datos para
los cuales razonablemente se pueden calcular los coeficientes de correlacin de Pearson, deberan
ser adecuados para el anlisis factorial.
Supuestos. Los datos deben tener una distribucin normal bivariada para cada pareja de variables
y las observaciones deben ser independientes. El modelo de anlisis factorial especifica que las
variables vienen determinadas por los factores comunes (los factores estimados por el modelo)
y por factores nicos (los cuales no se superponen entre las distintas variables observadas); las
estimaciones calculadas se basan en el supuesto de que ningn factor nico est correlacionado
con los dems, ni con los factores comunes.
Para obtener un anlisis factorial
E Elija en los mens:
Analizar
Reduccin de dimensiones
Anlisis factorial...
E Seleccione las variables para el anlisis factorial.
Figura 34-1
Cuadro de dilogo Anlisis factorial
425
Anlisis factorial
En el anlisis factorial, slo se usarn los casos con ese valor para la variable de seleccin.
casos vlidos para cada variable. La solucin inicial muestra las comunalidades iniciales, los
autovalores y el porcentaje de varianza explicada.
Matriz de correlaciones. Las opciones disponibles son: coeficientes, niveles de significacin,
Kaiser-Meyer-Olkin contrasta si las correlaciones parciales entre las variables son pequeas.
La prueba de esfericidad de Bartlett contrasta si la matriz de correlaciones es una matriz
identidad, que indicara que el modelo factorial es inadecuado.
426
Captulo 34
Mtodo. Permite especificar el mtodo de extraccin factorial. Los mtodos disponibles son:
la suma de los cuadrados de las diferencias entre las matrices de correlacin observada y
reproducida, ignorando las diagonales.
la suma de los cuadrados de las diferencias entre las matrices de correlacin observada y
reproducida. Las correlaciones se ponderan por el inverso de su unicidad, de manera que las
variables que tengan un valor alto de unicidad reciban una ponderacin menor que aqullas
que tengan un valor bajo de unicidad.
matriz de correlaciones original con los cuadrados de los coeficientes de correlacin mltiple
insertados en la diagonal principal como estimaciones iniciales de las comunalidades. Las
saturaciones factoriales resultantes se utilizan para estimar de nuevo las comunalidades
427
Anlisis factorial
Alfa. Mtodo de extraccin factorial que considera a las variables incluidas en el anlisis
como una muestra del universo de las variables posibles. Este mtodo maximiza el Alfa de
Cronbach para los factores.
basado en la teora de las imgenes. La parte comn de una variable, llamada la imagen
parcial, se define como su regresin lineal sobre las restantes variables, en lugar de ser una
funcin de los factores hipotticos.
Analizar. Permite especificar o una matriz de correlaciones o una matriz de covarianzas.
Matriz de correlaciones. Es til si las variables de su anlisis se miden sobre escalas distintas.
Matriz de covarianzas. Es til si se desea aplicar el anlisis factorial a varios grupos con
Solucin factorial sin rotar. Muestra las saturaciones factoriales sin rotar (la matriz de
Grfico de sedimentacin. Grfico de la varianza que se asocia a cada factor. Este grfico se
utiliza para determinar cuntos factores se deben retenerse. Tpicamente el grfico muestra la
clara ruptura entre la pronunciada pendiente de los factores ms importantes y el descenso
gradual de los restantes (los sedimentos).
N mximo de iteraciones para convergencia. Permite especificar el nmero mximo de pasos que
428
Captulo 34
Mtodo. Permite seleccionar el mtodo de rotacin factorial. Los mtodos disponibles son:
varimax, equamax, quartimax, oblimin directo y promax.
Mtodo varimax. Mtodo de rotacin ortogonal que minimiza el nmero de variables que
Criterio Oblimin directo. Mtodo para la rotacin oblicua (no ortogonal). Si delta es igual a cero
(el valor por defecto) las soluciones son las ms oblicuas. A medida que delta se va haciendo
ms negativo, los factores son menos oblicuos. Para anular el valor por defecto 0 para delta,
introduzca un nmero menor o igual que 0,8.
Mtodo quartimax. Mtodo de rotacin que minimiza el nmero de factores necesarios para
Mtodo equamax. Mtodo de rotacin que es combinacin del mtodo varimax, que simplifica
los factores, y el mtodo quartimax, que simplifica las variables. Se minimiza tanto el
nmero de variables que saturan alto en un factor como el nmero de factores necesarios
para explicar una variable.
Rotacin Promax. Rotacin oblicua que permite que los factores estn correlacionados. Esta
rotacin se puede calcular ms rpidamente que una rotacin oblimin directa, por lo que es
til para conjuntos de datos grandes.
Mostrar. Permite incluir los resultados de la solucin rotada, as como los grficos de las
Solucin rotada. Debe seleccionarse un mtodo de rotacin para obtener la solucin rotada.
factoriales para los tres primeros factores. En una solucin de dos factores, se representa un
diagrama bidimensional. Si slo se extrae un factor no se muestra el grfico. Si se solicita la
rotacin, los diagramas representan las soluciones rotadas.
N mximo de iteraciones para convergencia. Permite especificar el nmero mximo de pasos que
429
Anlisis factorial
Guardar como variables. Crea una nueva variable para cada factor en la solucin final.
Mtodo. Los mtodos alternativos para calcular las puntuaciones factoriales son: regresin,
Bartlett, y Anderson-Rubin.
Mtodo de regresin. Mtodo para estimar los coeficientes de las puntuaciones factoriales.
Las puntuaciones que se producen tienen una media de 0 y una varianza igual al cuadrado de
la correlacin mltiple entre las puntuaciones factoriales estimadas y los valores factoriales
verdaderos. Las puntuaciones puede correlacionarse incluso si los factores son ortogonales.
Puntuaciones de Bartlett. Mtodo para estimar los coeficientes de las puntuaciones factoriales.
Las puntuaciones resultantes tienen una media de 0. Se minimiza la suma de cuadrados de los
factores nicos sobre el rango de las variables.
Mtodo de Anderson-Rubin. Mtodo para calcular los coeficientes para las puntuaciones
factoriales; es una modificacin del mtodo de Bartlett, que asegura la ortogonalidad de los
factores estimados. Las puntuaciones resultantes tienen una media 0, una desviacin tpica
de 1 y no correlacionan entre s.
Mostrar matriz de coeficientes de las puntuaciones factoriales. Muestra los coeficientes por los
cuales se multiplican las variables para obtener puntuaciones factoriales. Tambin muestra las
correlaciones entre las puntuaciones factoriales.
Valores perdidos. Permite especificar el tratamiento que reciben los valores perdidos. Las
selecciones disponibles son: Excluir casos segn lista, Excluir casos segn pareja y Reemplazar
por la media.
Formato de presentacin de los coeficientes. Permite controlar aspectos de las matrices de
resultados. Los coeficientes se ordenan por tamao y se suprimen aquellos cuyos valores absolutos
sean menores que el valor especificado.
430
Captulo 34
Captulo
35
mtodo el procedimiento Anlisis de conglomerados en dos fases. Ofrece una serie de funciones
nicas que se detallan a continuacin:
Siempre que todas las variables sean del mismo tipo, el procedimiento Anlisis de conglomerados
jerrquico podr analizar variables de intervalo (continuas), de recuento o binarias.
Anlisis de conglomerados de K-medias. El uso del procedimiento Anlisis de conglomerados de
K-medias se limita a datos continuos y requiere que el usuario especifique previamente el nmero
de conglomerados y ofrece una serie de funciones nicas que se detallan a continuacin:
Posibilidad de guardar las distancias desde los centros de los conglomerados hasta los
distintos objetos.
Posibilidad de leer los centros de los conglomerados iniciales y guardar los centros de los
conglomerados finales desde un archivo SPSS Statistics externo.
431
432
Captulo 35
Captulo
36
(CF) que resume los registros, el algoritmo en dos fases puede analizar archivos de datos
de gran tamao.
Ejemplo. Las empresas minoristas y de venta de productos para el consumidor suelen aplicar
tcnicas de conglomeracin a los datos que describen los hbitos de consumo, sexo, edad,
nivel de ingresos, etc. de los clientes. Estas empresas adaptan sus estrategias de desarrollo de
productos y de marketing en funcin de cada grupo de consumidores para aumentar las ventas
y el nivel de fidelidad a la marca.
Estadsticos. El procedimiento genera criterios de informacin (AIC o BIC) segn el nmero de
conglomerados de la solucin, las frecuencias de los conglomerados para la conglomeracin final
y los estadsticos descriptivos por conglomerado para la conglomeracin final.
Diagramas. El procedimiento genera grficos de barras para las frecuencias de los conglomerados,
grficos de sectores para las frecuencias de los conglomerados y grficos de la importancia de las
variables.
433
434
Captulo 36
Figura 36-1
Cuadro de dilogo Anlisis de conglomerados en dos fases
Medida de distancia. Esta opcin determina cmo se calcula la similaridad entre dos
conglomerados.
entre las variables. Las variables continuas se supone que tienen una distribucin normal,
mientras que las variables categricas se supone que son multinomiales. Se supone que todas
las variables son independientes.
Eucldea. La medida eucldea es la distancia segn una lnea recta entre dos conglomerados.
conglomerados.
435
Anlisis de conglomerados en dos fases
representan los objetos que se van a conglomerar y las variables representan los atributos en los
que se va a basar la conglomeracin.
Orden de casos. Observe que el rbol de caractersticas de conglomerados y la solucin final
pueden depender del orden de los casos. Para minimizar los efectos del orden, ordene los casos
aleatoriamente. Puede que desee obtener varias soluciones distintas con los casos ordenados
en distintos rdenes aleatorios para comprobar la estabilidad de una solucin determinada. En
situaciones en que esto resulta difcil debido a unos tamaos de archivo demasiado grandes, se
pueden sustituir varias ejecuciones por una muestra de casos ordenados con distintos rdenes
aleatorios.
Supuestos. La medida de la distancia de la verosimilitud supone que las variables del modelo de
conglomerados son independientes. Adems, se supone que cada variable continua tiene una
distribucin normal (de Gauss) y que cada variable categrica tiene una distribucin multinomial.
Las comprobaciones empricas internas indican que este procedimiento es bastante robusto frente
a las violaciones tanto del supuesto de independencia como de las distribuciones, pero an as es
preciso tener en cuenta hasta qu punto se cumplen estos supuestos.
Si lo desea, puede:
Seleccionar los ajustes para el tratamiento del ruido, la asignacin de memoria, la tipificacin
de las variables y la entrada del modelo de conglomerados.
Guardar los resultados del modelo en el archivo de trabajo o en un archivo XML externo.
436
Captulo 36
Tratamiento de valores atpicos. Este grupo permite tratar los valores atpicos de manera especial
durante la conglomeracin si se llena el rbol de caractersticas de los conglomerados (CF).
El rbol CF se considera lleno si no puede aceptar ningn caso ms en un nodo hoja y no hay
ningn nodo hoja que se pueda dividir.
Si selecciona el tratamiento del ruido y el rbol CF se llena, se har volver a crecer despus
de colocar los casos existentes en hojas poco densas en una hoja de ruido. Se considera
que una hoja es poco densa si contiene un nmero de casos inferior a un determinado
porcentaje de casos del mximo tamao de hoja. Tras volver a hacer crecer el rbol, los
valores atpicos se colocarn en el rbol CF en caso de que sea posible. Si no es as, se
descartarn los valores atpicos.
Consulte con el administrador del sistema si desea conocer el valor mximo que puede
especificar en su sistema.
Si este valor es demasiado bajo, es posible que el algoritmo no consiga obtener el nmero
correcto o deseado de conglomerados.
tipificadas. Todas las variables continuas que no estn tipificadas deben dejarse como variables en
la lista Para tipificar. Para ahorrar algn tiempo y trabajo para el ordenador, puede seleccionar
437
Anlisis de conglomerados en dos fases
todas las variables continuas que ya haya tipificado como variables en la lista Asumidas como
tipificadas.
Opciones avanzadas
Criterios de ajuste del rbol CF. Los siguientes ajustes del algoritmo de conglomeracin se aplican
Umbral del cambio en distancia inicial. ste es el umbral inicial que se utiliza para hacer crecer
el rbol CF. Si se ha insertado una determinada hoja en el rbol CF que producira una densidad
inferior al umbral, la hoja no se dividir. Si la densidad supera el umbral, se dividir la hoja.
N mximo de ramas (por nodo hoja). Nmero mximo de nodos filiales que puede tener una
hoja.
Mxima profundidad de rbol. Nmero mximo de niveles que puede tener un rbol CF.
Mximo nmero posible de nodos. Indica el nmero mximo de nodos del rbol CF que puede
Actualizacin del modelo de conglomerados. Este grupo permite importar y actualizar un modelo
438
Captulo 36
Grfico del porcentaje intra-conglomerado. Muestra los grficos que indican la variacin dentro
del conglomerado de cada variable. Para cada variable categrica, se genera un grfico de barras
agrupado, mostrando la frecuencia de la categora por identificador de conglomerado. Para
cada variable continua, se genera un grfico de barras de error, indicando las barras de error
por identificador de conglomerado.
Grfico de sectores de los conglomerados. Muestra un grfico de sectores que muestra el porcentaje
Ordenar variables. Esta opcin determina si los grficos que se crearn para cada conglomerado
Nivel de confianza. Esta opcin permite establecer el nivel de confianza para la prueba de
439
Anlisis de conglomerados en dos fases
del nivel de confianza se muestra como una lnea vertical en los grficos de la importancia de
las variables, si los grficos se crean por variable o si se representa grficamente la medida
de la significacin.
Omitir variables no significativas. Las variables que no son significativas para el nivel de
Estadsticos. Este grupo proporciona opciones para la presentacin de tablas con los resultados de
la conglomeracin. Se generan los estadsticos descriptivos y las frecuencias de los conglomerados
para el modelo de conglomerados final, mientras que la tabla de criterio de informacin muestra
los resultados correspondientes a varias soluciones de conglomerados.
Descriptivos por conglomerado. Muestra dos tablas que describen las variables de cada
conglomerado. En una tabla, se informa de las medias y las desviaciones tpicas para las
variables continuas por conglomerado. La otra tabla informa de las frecuencias de las
variables categricas por conglomerado.
Frecuencias de los conglomerados. Muestra una tabla que informa del nmero de
Criterio de informacin (AIC o BIC). Muestra una tabla que contiene los valores de AIC o BIC,
dependiendo del criterio elegido en el cuadro de dilogo principal, para diferentes nmeros
de conglomerados. Slo se proporciona esta tabla cuando el nmero de conglomerados se
determina automticamente. Si el nmero de conglomerados es fijo, se ignora este ajuste y
no se proporciona la tabla.
440
Captulo 36
Archivo de datos de trabajo. Este grupo permite guardar las variables en el conjunto de datos activo.
identificacin de conglomerado para cada caso. El nombre de esta variable es tsc_n, donde n
es un nmero entero positivo que indica el ordinal de la operacin de almacenamiento del
conjunto de datos activo realizada por este procedimiento en una determinada sesin.
Archivos XML. El modelo de conglomerados final y el rbol CF son dos tipos de archivos de
Exportar modelo final. Tambin se puede exportar el modelo de conglomerado final al archivo
Exportar rbol CF. Esta opcin permite guardar el estado actual del rbol de conglomerados y
Captulo
37
similares dentro de cada grupo? Con el anlisis de conglomerados jerrquico, podra agrupar los
programas de TV (los casos) en grupos homogneos basados en las caractersticas del espectador.
Esto se puede utilizar para identificar segmentos de mercado. Tambin puede agrupar ciudades
(los casos) en grupos homogneos, de manera que se puedan seleccionar ciudades comparables
para probar diversas estrategias de marketing.
Estadsticos. Historial de conglomeracin, matriz de distancias (o similaridades) y pertenencia a
los conglomerados para una solucin nica o una serie de soluciones. Grficos: dendrogramas
y diagramas de tmpanos.
Datos. Las variables pueden ser cuantitativas, binarias o datos de recuento (frecuencias). El
escalamiento de las variables es un aspecto importante, ya que las diferencias en el escalamiento
pueden afectar a las soluciones de conglomeracin. Si las variables muestran grandes diferencias
en el escalamiento (por ejemplo, una variable se mide en dlares y la otra se mide en aos),
debera considerar la posibilidad de estandarizarlas (esto puede llevarse a cabo automticamente
mediante el propio procedimiento Anlisis de conglomerados jerrquico).
Orden de casos. Si hay distancias empatadas o similitudes en los datos de entrada o si stas se
441
442
Captulo 37
E Si est aglomerando casos, seleccione al menos una variable numrica. Si est aglomerando
443
Anlisis de conglomerados jerrquico
Binaria. Las opciones disponibles son: Distancia eucldea, Distancia eucldea al cuadrado,
antes de calcular las proximidades (no est disponible para datos binarios). Los mtodos
disponibles de estandarizacin son: Puntuaciones z, Rango -1 a 1, Rango 0 a 1, Magnitud mxima
de 1, Media de 1 y Desviacin tpica 1.
Transformar medidas. Permite transformar los valores generados por la medida de distancia.
Se aplican despus de calcular la medida de distancia. Las opciones disponibles son: Valores
absolutos, Cambiar el signo y Cambiar la escala al rango 01.
444
Captulo 37
las distancias entre los casos o los conglomerados que se combinan, as como el ltimo nivel
del proceso de aglomeracin en el que cada caso (o variable) se uni a su conglomerado
correspondiente.
Matriz de distancias. Proporciona las distancias o similaridades entre los elementos.
Conglomerado de pertenencia. Muestra el conglomerado al cual se asigna cada caso en una o
varias etapas de la combinacin de los conglomerados. Las opciones disponibles son: Solucin
nica y Rango de soluciones.
445
Anlisis de conglomerados jerrquico
446
Captulo 37
solucin nica o un rango de soluciones. Las variables guardadas pueden emplearse en anlisis
posteriores para explorar otras diferencias entre los grupos.
Captulo
Anlisis de conglomerados de
K-medias
38
parecidas dentro de cada grupo? Con el anlisis de conglomerados de k-medias, podra agrupar
los programas de televisin (los casos) en k grupos homogneos, basados en las caractersticas
del televidente. Este proceso se puede utilizar para identificar segmentos de mercado. Tambin
puede agrupar ciudades (los casos) en grupos homogneos, de manera que se puedan seleccionar
ciudades comparables para probar diversas estrategias de marketing.
Estadsticos. Para la solucin completa: centros iniciales de los conglomerados, tabla de ANOVA.
Para cada caso: informacin del conglomerado, distancia desde el centro del conglomerado.
Datos. Las variables deben ser cuantitativas en el nivel de intervalo o de razn. Si las variables
448
Captulo 38
Supuestos. Las distancias se calculan utilizando la distancia eucldea simple. Si desea utilizar
449
Anlisis de conglomerados de K-medias
E Si lo desea, seleccione una variable de identificacin para etiquetar los casos.
Nota: estas opciones slo estn disponibles si se selecciona el mtodo Iterar y clasificar en el cuadro
de dilogo Anlisis de conglomerados de K-medias.
N mximo de iteraciones. Limita el nmero de iteraciones en el algoritmo k-medias. La iteracin
se detiene despus de este nmero de iteraciones, incluso si no se ha satisfecho el criterio de
convergencia. Este nmero debe estar entre el 1 y el 999.
Para reproducir el algoritmo utilizado por el comando Quick Cluster en las versiones previas a
la 5.0, establezca Mximo de iteraciones en 1.
Criterio de convergencia. Determina cundo cesa la iteracin. Representa una proporcin de la
distancia mnima entre los centros iniciales de los conglomerados, por lo que debe ser mayor que 0
pero no mayor que 1. Por ejemplo, si el criterio es igual a 0,02, la iteracin cesar si una iteracin
completa no mueve ninguno de los centros de los conglomerados en una distancia superior al dos
por ciento de la distancia menor entre cualquiera de los centros iniciales.
Usar medias actualizadas. Permite solicitar la actualizacin de los centros de los conglomerados
tras la asignacin de cada caso. Si no selecciona esta opcin, los nuevos centros de los
conglomerados se calcularn despus de la asignacin de todos los casos.
450
Captulo 38
Puede guardar informacin sobre la solucin como nuevas variables para que puedan ser utilizadas
en anlisis subsiguientes:
Conglomerado de pertenencia. Crea una nueva variable que indica el conglomerado final al
que pertenece cada caso. Los valores de la nueva variable van desde el 1 hasta el nmero de
conglomerados.
Distancia desde centro del conglomerado. Crea una nueva variable que indica la distancia eucldea
Centros de conglomerados iniciales. Primera estimacin de las medias de las variables para
cada uno de los conglomerados. Por defecto se selecciona entre los datos un nmero de
casos debidamente espaciados igual al nmero de conglomerados. Los centros iniciales de
los conglomerados se utilizan como criterio para una primera clasificacin y, a partir de
ah, se van actualizando.
451
Anlisis de conglomerados de K-medias
Tabla de ANOVA. Muestra una tabla de anlisis de varianza que incluye las pruebas F
univariadas para cada variable de aglomeracin. Las pruebas F son slo descriptivas y las
probabilidades resultantes no se deben interpretar. La tabla de ANOVA no se mostrar si se
asignan todos los casos a un nico conglomerado.
Informacin del conglomerado para cada caso. Muestra, para cada caso, el conglomerado
final asignado y la distancia eucldea entre el caso y el centro del conglomerado utilizado
para clasificar el caso. Tambin muestra la distancia eucldea entre los centros de los
conglomerados finales.
Valores perdidos. Las opciones disponibles son: Excluir casos segn lista o Excluir casos segn
pareja.
Excluir casos segn lista. Excluye los casos con valores perdidos para cualquier variable
Excluir casos segn pareja. Asigna casos a los conglomerados en funcin de las distancias que
Aceptar los primeros casos k como primeros centros de conglomerados iniciales y, por lo
tanto, evitar la lectura de datos que normalmente se utiliza para calcularlos.
Captulo
Pruebas no paramtricas
39
Prueba de chi-cuadrado
El procedimiento Prueba de chi-cuadrado tabula una variable en categoras y calcula un estadstico
de chi-cuadrado. Esta prueba de bondad de ajuste compara las frecuencias observadas y esperadas
en cada categora para contrastar que todas las categoras contengan la misma proporcin de
valores o que cada categora contenga una proporcin de valores especificada por el usuario.
Ejemplos. La prueba de chi-cuadrado podra utilizarse para determinar si una bolsa de caramelos
contiene en igualdad de proporcin caramelos de color azul, marrn, verde, naranja, rojo y
amarillo. Tambin podra utilizarse para ver si una bolsa de caramelos contiene un 5% de color
452
453
Pruebas no paramtricas
azul, un 30% de color marrn, un 10% de color verde, un 20% de color naranja, un 15% de
color rojo y un 15% de color amarillo.
Estadsticos. Media, desviacin tpica, mnimo, mximo y cuartiles. Nmero y porcentaje de casos
perdidos y no perdidos; nmero de casos observados y esperados de cada categora; residuos y
estadstico de chi-cuadrado.
Datos. Use variables categricas numricas ordenadas o no ordenadas (niveles de medida ordinal
o nominal). Para convertir las variables de cadena en variables numricas, utilice el procedimiento
Recodificacin automtica, disponible en el men Transformar.
Supuestos. Las pruebas no paramtricas no requieren supuestos sobre la forma de la distribucin
subyacente. Se asume que los datos son una muestra aleatoria. Las frecuencias esperadas para
cada categora debern ser 1 como mnimo. No ms de un 20% de las categoras debern tener
frecuencias esperadas menores que 5.
Para obtener una prueba de chi-cuadrado
E En los mens, seleccione:
Analizar
Pruebas no paramtricas
Chi-cuadrado...
Figura 39-1
Cuadro de dilogo Prueba de chi-cuadrado
E Seleccione una o ms variables de contraste. Cada variable genera una prueba independiente.
E Si lo desea, puede pulsar en Opciones para obtener estadsticos descriptivos, cuartiles y controlar
454
Captulo 39
categoras pueden tener proporciones esperadas especificadas por el usuario. Seleccione Valores,
introduzca un valor mayor que 0 para cada categora de la variable de contraste y, a continuacin,
pulse en Aadir. Cada vez que se aade un valor, ste aparece al final de la lista de valores. El
orden de los valores es importante; corresponde al orden ascendente de los valores de categora de
la variable de contraste. El primer valor de la lista corresponde al valor de grupo mnimo de la
variable de contraste y el ltimo valor corresponde al valor mximo. Los elementos de la lista de
valores se suman y, a continuacin, cada valor se divide por esta suma para calcular la proporcin
de casos esperados en la categora correspondiente. Por ejemplo, una lista de valores de 3, 4, 5, 4
especifica unas proporciones esperadas de 3/16, 4/16, 5/16 y 4/16.
casos no perdidos.
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se evala
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable se excluyen
455
Pruebas no paramtricas
Especificar diferentes valores mnimo y mximo o las frecuencias esperadas para diferentes
variables (mediante el subcomando CHISQUARE).
Contrastar la misma variable respecto a las diferentes frecuencias esperadas, o bien usar
diferentes rangos (mediante el subcomando EXPECTED).
Prueba binomial
El procedimiento Prueba binomial compara las frecuencias observadas de las dos categoras
de una variable dicotmica con las frecuencias esperadas en una distribucin binomial con un
parmetro de probabilidad especificado. Por defecto, el parmetro de probabilidad para ambos
grupos es 0,5. Para cambiar las probabilidades, puede introducirse una proporcin de prueba para
el primer grupo. La probabilidad del segundo grupo ser 1 menos la probabilidad especificada
para el primer grupo.
Ejemplo. Si se lanza una moneda al aire, la probabilidad de que salga cara es 1/2. Basndose en
esta hiptesis, se lanza una moneda al aire 40 veces y se anotan los resultados (cara o cruz). De la
prueba binomial, podra deducir que en 3/4 de los lanzamientos sali cara y que el nivel crtico es
pequeo (0,0027). Estos resultados indican que no es verosmil que la probabilidad de que salga
cara sea 1/2; probablemente la moneda presenta una tendencia a caer por un sentido determinado.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos y cuartiles.
Datos. Las variables de contraste deben ser numricas y dicotmicas. Para convertir las variables
456
Captulo 39
Figura 39-3
Cuadro de dilogo Prueba binomial
casos no perdidos.
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se evala
Excluir casos segn lista. Se excluirn de todos los anlisis los casos con valores perdidos de
cualquier variable.
457
Pruebas no paramtricas
Seleccionar grupos especficos (y excluir otros grupos) si una variable tiene ms de dos
categoras (mediante el subcomando BINOMIAL).
Prueba de rachas
El procedimiento Prueba de rachas contrasta si es aleatorio el orden de aparicin de dos valores de
una variable. Una racha es una secuencia de observaciones similares. Una muestra con un nmero
excesivamente grande o excesivamente pequeo de rachas sugiere que la muestra no es aleatoria.
Ejemplos. Suponga que se realiza una encuesta a 20 personas para saber si compraran un
producto. Si todas estas personas fueran del mismo sexo, se pondra seriamente en duda la
supuesta aleatoriedad de la muestra. La prueba de rachas se puede utilizar para determinar si
la muestra fue extrada de manera aleatoria.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos y cuartiles.
Datos. Las variables deben ser numricas. Para convertir las variables de cadena en variables
numricas, utilice el procedimiento Recodificacin automtica, disponible en el men Transformar.
Supuestos. Las pruebas no paramtricas no requieren supuestos sobre la forma de la distribucin
458
Captulo 39
Figura 39-5
Adicin de un punto de corte personalizado
utilizar como punto de corte los valores observados para la media, la mediana o la moda, o bien un
valor especificado. Los casos con valores menores que el punto de corte se asignarn a un grupo y
los casos con valores mayores o iguales que el punto de corte se asignarn a otro grupo. Se lleva a
cabo una prueba para cada punto de corte seleccionado.
459
Pruebas no paramtricas
casos no perdidos.
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se evala
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable se excluyen
Especificar puntos de corte diferentes para las distintas variables (con el subcomando RUNS).
Contrastar la misma variable con distintos puntos de corte personalizados (con el subcomando
RUNS).
La prueba de Kolmogorov-Smirnov para una muestra se puede utilizar para comprobar que una
variable (por ejemplo ingresos) se distribuye normalmente.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos y cuartiles.
Datos. Utilice variables cuantitativas (a nivel de medida de razn o de intervalo).
Supuestos. La prueba de Kolmogorov-Smirnov asume que los parmetros de la distribucin de
contraste se han especificado previamente. Este procedimiento estima los parmetros a partir de la
muestra. La media y la desviacin tpica de la muestra son los parmetros de una distribucin
normal, los valores mnimo y mximo de la muestra definen el rango de la distribucin uniforme,
la media muestral es el parmetro de la distribucin de Poisson y la media muestral es el parmetro
de la distribucin exponencial. La capacidad de la prueba para detectar desviaciones a partir de
la distribucin hipotetizada puede disminuir gravemente. Para contrastarla con una distribucin
normal con parmetros estimados, considere la posibilidad de utilizar la prueba de K-S Lillliefors
(disponible en el procedimiento Explorar).
460
Captulo 39
E Seleccione una o ms variables de contraste numricas. Cada variable genera una prueba
independiente.
E Si lo desea, puede pulsar en Opciones para obtener estadsticos descriptivos, cuartiles y controlar
casos no perdidos.
461
Pruebas no paramtricas
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se evala
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable se excluyen
462
Captulo 39
Figura 39-9
Cuadro de dilogo Pruebas para dos muestras independientes
463
Pruebas no paramtricas
muestras proceden de una misma poblacin, los dos grupos deben dispersarse aleatoriamente en la
ordenacin de los rangos.
La prueba de reacciones extremas de Moses presupone que la variable experimental afectar
a algunos sujetos en una direccin y a otros sujetos en la direccin opuesta. La prueba contrasta
las respuestas extremas comparndolas con un grupo de control. Esta prueba se centra en la
amplitud del grupo de control y supone una medida de la influencia de los valores extremos del
grupo experimental en la amplitud al combinarse con el grupo de control. El grupo de control se
define en el cuadro Grupo 1 del cuadro de dilogo Dos muestras independientes: Definir grupos.
Las observaciones de ambos grupos se combinan y ordenan. La amplitud del grupo de control se
calcula como la diferencia entre los rangos de los valores mayor y menor del grupo de control ms
1. Debido a que los valores atpicos ocasionales pueden distorsionar fcilmente el rango de la
amplitud, de manera automtica se recorta de cada extremo un 5% de los casos de control.
Para segmentar el archivo en dos grupos o muestras, introduzca un valor entero para el Grupo 1 y
otro valor para el Grupo 2. Los casos con otros valores se excluyen del anlisis.
casos no perdidos.
464
Captulo 39
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se evala
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable se excluyen
inicialmente? Si aplica la prueba de Wilcoxon de los rangos con signo a 10 casas, podra descubrir
que siete familias reciben menos cantidad de la solicitada, una recibe ms y dos familias reciben
el precio solicitado.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos y cuartiles.
Pruebas: Wilcoxon de los rangos con signo, signo, McNemar. Si se ha instalado la opcin Pruebas
exactas (disponible slo en los sistemas operativos Windows), la prueba de homogeneidad
marginal tambin estar disponible.
Datos. Utilice variables numricas que puedan ser ordenables.
Supuestos. Aunque no se suponen distribuciones en particular para las dos variables, se supone
que la distribucin de poblacin de las diferencias emparejadas es simtrica.
Para obtener pruebas para dos muestras relacionadas
E En los mens, seleccione:
Analizar
Pruebas no paramtricas
2 muestras relacionadas...
465
Pruebas no paramtricas
Figura 39-12
Cuadro de dilogo Pruebas para dos muestras relacionadas
466
Captulo 39
casos no perdidos.
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se evala
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable se excluyen
tres marcas distintas? A partir del anlisis de varianza de un factor de Kruskal-Wallis, puede
comprobar que las tres marcas s se diferencian en su vida media.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos y cuartiles.
467
Pruebas no paramtricas
468
Captulo 39
Para definir el rango, introduzca valores enteros para el mnimo y el mximo que se correspondan
con las categoras mayor y menor de la variable de agrupacin. Se excluyen los casos con
valores fuera de los lmites. Por ejemplo, si indica un valor mnimo de 1 y un valor mximo de
3, nicamente se utilizarn los valores enteros entre 1 y 3. Debe indicar ambos valores y el
valor mnimo ha ser menor que el mximo.
casos no perdidos.
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se evala
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable se excluyen
469
Pruebas no paramtricas
470
Captulo 39
casos no perdidos.
Captulo
40
Se ofrecen dos procedimientos para analizar los conjuntos de categoras mltiples y de dicotomas
mltiples. El procedimiento Frecuencias de respuestas mltiples muestra tablas de frecuencias.
El procedimiento Tablas de contingencia de respuestas mltiples muestra tablas de contingencia
de dos y tres dimensiones. Antes de utilizar cualquiera de estos procedimientos, deber definir
conjuntos de respuestas mltiples.
Ejemplo. Este ejemplo ilustra el uso de elementos de respuestas mltiples en un estudio de
investigacin de mercado. Los datos son ficticios y no deben interpretarse como reales. Una lnea
area podra hacer una encuesta a los pasajeros que realicen una determinada ruta para evaluar
las lneas areas de la competencia. En este ejemplo, American Airlines desea conocer el uso
que hacen sus pasajeros de otras lneas areas en la ruta Chicago-Nueva York y la importancia
relativa del horario y el servicio a la hora de seleccionar una lnea area. El encargado del vuelo
proporciona a cada pasajero un breve cuestionario durante el embarque. La primera pregunta
dice: Rodee con un crculo todas las lneas areas con la que haya volado al menos una vez en
los ltimos seis meses en este mismo trayecto: American, United, TWA, USAir, Otras. Se trata
de una pregunta de respuestas mltiples, ya que el pasajero puede marcar ms de una respuesta.
Sin embargo, la pregunta no se puede codificar directamente, ya que una variable slo puede
tener un valor para cada caso. Deber utilizar distintas variables para asignar respuestas a cada
pregunta. Existen dos formas de hacerlo. Una consiste en definir una variable para cada una de las
opciones (por ejemplo, American, United, TWA, USAir y Otras). Si el pasajero marca United, a la
variable united se le asignar el cdigo 1; en caso contrario se le asignar 0. ste es un mtodo
de dicotomas mltiples de asignacin de variables. La otra forma de asignar respuestas es el
mtodo de categoras mltiples, en el que se estima el nmero mximo de posibles respuestas a
la pregunta y se configura el mismo nmero de variables, con cdigos para especificar la lnea
area utilizada. Examinando una muestra de cuestionarios, podra observarse que ningn usuario
ha volado en ms de tres lneas areas diferentes en esta ruta durante los ltimos seis meses.
An ms, se observar que debido a la liberalizacin de las lneas areas, aparecen otras 10 en
la categora Otras. Con el mtodo de respuestas mltiples, definira tres variables, cada una
codificada como 1 = american, 2 = united, 3 = twa, 4 = usair, 5 = delta y as sucesivamente. Si un
pasajero determinado marca American y TWA, la primera variable tendr el cdigo 1, la segunda
el 3 y la tercera un cdigo de valor perdido. Otro pasajero podra haber marcado American
e introducido Delta. As, la primera variable tendr el cdigo 1, la segunda el 5 y la tercera un
cdigo de valor perdido. Por el contrario, si utiliza el mtodo de dicotomas mltiples, terminar
con 14 variables independientes. Aunque cualquiera de los mtodos de asignacin anteriores es
viable para este estudio, el mtodo seleccionado depender de la distribucin de respuestas.
471
472
Captulo 40
473
Anlisis de respuestas mltiples
Figura 40-1
Cuadro de dilogo Definir conjuntos de respuestas mltiples
Excluir los casos segn lista dentro de las dicotomas. Excluye los casos con valores perdidos
474
Captulo 40
algunas variables, pero no en todas, se incluyen en las tabulaciones del grupo si al menos una
variable contiene el valor contado.
Excluir los casos segn lista dentro de las categoras. Excluye los casos con valores perdidos
en cualquier variable de la tabulacin del conjunto de categoras mltiples. Esto slo se aplica
a conjuntos de respuestas mltiples definidos como conjuntos de categoras. Por defecto, un
caso se considera perdido para un conjunto de categoras mltiples slo si ninguno de sus
componentes tiene valores vlidos dentro del rango definido.
Ejemplo. Cada variable creada a partir de una pregunta de una encuesta es una variable elemental.
Para analizar un elemento de respuestas mltiples, deber combinar las variables en uno o dos
tipos de conjuntos de respuestas mltiples: un conjunto de dicotomas mltiples o un conjunto de
categoras mltiples. Por ejemplo, si una encuesta sobre lneas areas preguntara al encuestado
cul de las tres lneas (American, United, TWA) ha utilizado durante los seis ltimos meses y usted
utilizara variables dicotmicas y definiera un conjunto de dicotomas mltiples, cada una de las
tres variables del conjunto se convertira en una categora de la variable de grupo. Las frecuencias
y los porcentajes de las tres lneas areas se muestran en una tabla de frecuencias. Si observa que
ningn encuestado ha mencionado ms de dos lneas areas, podra crear dos variables, cada una
con tres cdigos, uno para cada lnea area. Si define un conjunto de categoras mltiples, los
valores se tabulan aadiendo los mismos cdigos en las variables elementales juntas. El conjunto
de valores resultantes es igual a los de cada una de las variables elementales. Por ejemplo, 30
respuestas para United son la suma de las cinco respuestas de United para la lnea area 1 y las
25 respuestas de United para la lnea area 2. Las frecuencias y los porcentajes de las tres lneas
areas se muestran en una tabla de frecuencias.
Estadsticos. Tablas de frecuencias que muestran recuentos, porcentajes de respuestas, porcentajes
de cualquier distribucin.
Procedimientos relacionados. El procedimiento Definir conjuntos de respuestas mltiples permite
definir este tipo de conjuntos.
Para obtener frecuencias de respuestas mltiples
E En los mens, seleccione:
Analizar
Respuesta mltiple
Frecuencias...
475
Anlisis de respuestas mltiples
Figura 40-2
Cuadro de dilogo Frecuencias de respuestas mltiples
porcentajes de casilla, fila, columna y totales. Los porcentajes de casilla se basan en casos o
respuestas.
476
Captulo 40
de cualquier distribucin.
Procedimientos relacionados. El procedimiento Definir conjuntos de respuestas mltiples permite
definir este tipo de conjuntos.
Para obtener tablas de contingencia de respuestas mltiples
E En los mens, seleccione:
Analizar
Respuesta mltiple
Tablas de contingencia...
Figura 40-3
Cuadro de dilogo Tablas de contingencia de respuestas mltiples
Si lo desea, puede obtener una tabla de contingencia de doble clasificacin para cada categora de
una variable de control o conjunto de respuestas mltiples. Seleccione uno o varios elementos
para la lista Capas.
477
Anlisis de respuestas mltiples
Los rangos de valores deben definirse para cualquier variable elemental de la tabla de contingencia.
Introduzca los valores enteros de categora mximos y mnimos que desee tabular. Las categoras
que estn fuera del rango se excluyen del anlisis. Se entiende que los valores que estn dentro del
rango inclusivo son enteros (los no enteros quedan truncados).
Porcentajes de casilla. Las frecuencias de la casilla siempre se muestran. Puede elegir entre
mostrar los porcentajes de fila, los de columna o los de tabla de doble clasificacin (totales).
Porcentajes basados en. Los porcentajes de casilla pueden basarse en casos (o encuestados). Esta
Excluir los casos segn lista dentro de las dicotomas. Excluye los casos con valores perdidos
Excluir los casos segn lista dentro de las categoras. Excluye los casos con valores perdidos
en cualquier variable de la tabulacin del conjunto de categoras mltiples. Esto slo se aplica
a conjuntos de respuestas mltiples definidos como conjuntos de categoras. Por defecto, un
caso se considera perdido para un conjunto de categoras mltiples slo si ninguno de sus
componentes tiene valores vlidos dentro del rango definido.
478
Captulo 40
Por defecto, cuando se presentan dos conjuntos de categoras mltiples en forma de tabla de
contingencia, el procedimiento tabula cada variable del primer grupo con cada variable del
segundo y suma las frecuencias de cada casilla; de esta forma, algunas respuestas pueden aparecer
ms de una vez en una tabla. Puede seleccionar la opcin siguiente:
Emparejar las variables entre los conjuntos de respuesta. Empareja la primera variable del primer
grupo con la primera variable del segundo, y as sucesivamente. Si selecciona esta opcin, el
procedimiento basar los porcentajes de casilla en las respuestas en lugar de hacerlo en los
encuestados. El emparejamiento no est disponible para conjuntos de dicotomas mltiples o
variables elementales.
Captulo
41
Los listados de casos y los estadsticos descriptivos son herramientas bsicas para estudiar y
presentar los datos. Puede obtener listados de casos con el Editor de datos o el procedimiento
Resumir, frecuencias y estadsticos descriptivos con el procedimiento Frecuencias, y estadsticos
de subpoblacin con el procedimiento Medias. Cada uno utiliza un formato diseado para que
la informacin sea clara. Si desea ver la informacin con otro formato, las opciones Informe de
estadsticos en filas e Informe de estadsticos en columnas le ofrecen el control que precisa para
presentar los datos.
de datos para cada caso. Esto genera un informe a modo de listado, que puede ser mucho ms
largo que un informe de resumen.
479
480
Captulo 41
Presentacin preliminar. Muestra slo la primera pgina del informe. Esta opcin es til para ver
una presentacin preliminar del formato del informe sin tener que procesar el informe completo.
Los datos estn ordenados. Para los informes con variables de ruptura, el archivo de datos se debe
ordenar por los valores de estas variables antes de generar el informe. Si el archivo de datos ya est
ordenado por estos valores, se puede ahorrar tiempo de procesamiento seleccionando esta opcin.
Esta opcin es especialmente til despus de generar la presentacin preliminar de un informe.
medidas de resumen.
Figura 41-1
Cuadro de dilogo Informe: Estadsticos en filas
481
Informes de los resultados
Ttulo de la columna. Para la variable seleccionada, controla el ttulo de la columna. Los ttulos
largos se ajustan de forma automtica dentro de la columna. Utilice la tecla Intro para insertar
manualmente lneas de separacin donde desee ajustar los ttulos.
Posicin de valor en la columna. Para la variable seleccionada, controla la alineacin de los valores
de los datos o de las etiquetas de valor dentro de la columna. La alineacin de los valores o de las
etiquetas no afecta a la alineacin de los encabezados de las columnas. Puede sangrar el contenido
de la columna por un nmero especfico de caracteres o centrar el contenido.
Contenido de la columna. Para la variable seleccionada, controla la presentacin de los valores de
los datos o de las etiquetas de valor definidas. Los valores de los datos siempre se muestran para
cualquier valor que no tenga etiquetas de valor definidas. No se encuentra disponible para las
columnas de datos en los informes estadsticos en columnas.
482
Captulo 41
Figura 41-3
Cuadro de dilogo Informe: Lneas de resumen
Los estadsticos de resumen disponibles son: suma, media, valor mnimo, valor mximo, nmero
de casos, porcentaje de casos por encima y por debajo de un valor especificado, porcentaje de
casos dentro de un rango de valores especificado, desviacin tpica, curtosis, varianza y asimetra.
etiquetas o los datos de la categora de ruptura y los estadsticos de resumen. Esta opcin es
especialmente til para los informes combinados que incluyan tanto el listado de los casos
individuales como los estadsticos de resumen para las categoras de ruptura; en estos informes
puede insertar un espacio entre el listado de los casos y los estadsticos de resumen.
483
Informes de los resultados
Figura 41-5
Cuadro de dilogo Informe: Opciones
Excluir casos con valores perdidos segn lista. Elimina (del informe) cualquier caso con valores
perdidos en el archivo de datos. Este smbolo slo puede tener un carcter y se utiliza para
representar tanto los valores perdidos del sistema como los valores perdidos definidos por
el usuario.
Numerar las pginas desde la. Permite especificar un nmero de pgina para la primera pgina
del informe.
Diseo de pgina. Controla los mrgenes de las pginas expresados en lneas (extremos superior e
inferior) y caracteres (a la izquierda y a la derecha) y la alineacin del informe entre los mrgenes.
Ttulos y pies de pgina. Controla el nmero de lneas que separan los ttulos y los pies de pgina
484
Captulo 41
de datos (valores de datos o estadsticos de resumen) en relacin con las etiquetas de ruptura al
principio de cada categora de ruptura. La primera fila de informacin puede empezar en la misma
lnea que la etiqueta de categora de ruptura o en un nmero de lneas posterior especificado. Esta
seccin no se encuentra disponible para los informes de estadsticos en columnas.
Si inserta variables en los ttulos o en los pies de pgina, la etiqueta de valor o el valor de la
variable actual aparecer en el ttulo o en el pie de pgina. Para los ttulos se mostrar la etiqueta
de valor correspondiente al valor de la variable al principio de la pgina; para los pies de pgina,
esta etiqueta se mostrar al final de la pgina. Si no hay etiqueta de valor, se mostrar el valor real.
Variables especiales. Las variables especiales DATE y PAGE permiten insertar la fecha actual
o el nmero de pgina en cualquier lnea de un encabezado o pie del informe. Si el archivo de
datos contiene variables llamadas DATE o PAGE, no podr utilizar estas variables en los ttulos
ni en los pies del informe.
485
Informes de los resultados
incluyendo el salario, el cargo y la seccin en la que trabaja cada uno. Se podra generar un
informe que proporcione los estadsticos de salario resumidos (por ejemplo, media, mnimo y
mximo) para cada seccin.
Columnas de datos. Muestra una lista de las variables del informe para las que se desea obtener
una presentacin preliminar del formato del informe sin tener que procesar el informe completo.
Los datos estn ordenados. Para los informes con variables de ruptura, el archivo de datos se debe
ordenar por los valores de estas variables antes de generar el informe. Si el archivo de datos ya est
ordenado por estos valores, se puede ahorrar tiempo de procesamiento seleccionando esta opcin.
Esta opcin es especialmente til despus de generar la presentacin preliminar de un informe.
de origen y desplcela hasta la lista Columnas de datos varias veces, una para cada medida que
desee obtener.
E Para mostrar una columna con la suma, la media, la razn o cualquier otra funcin de las columnas
existentes, pulse en Insertar total. Al hacerlo se situar una variable llamada total en la lista
Columnas de datos.
486
Captulo 41
E Para los informes ordenados y mostrados por subgrupos, seleccione una o ms variables para
487
Informes de los resultados
Figura 41-9
Cuadro de dilogo Informe: Lneas de resumen
Los estadsticos de resumen disponibles son: suma, media, valor mnimo, valor mximo, nmero
de casos, porcentaje de casos por encima y por debajo de un valor especificado, porcentaje de
casos dentro de un rango de valores especificado, desviacin tpica, varianza, curtosis y asimetra.
Suma de columnas. La columna total es la suma de las columnas de la lista Columna de resumen.
488
Captulo 41
Media de columnas. La columna total es la media de las columnas de la lista Columna de resumen.
Mnimo de columnas. La columna total es el mnimo de las columnas de la lista Columna de
resumen.
Mximo de columnas. La columna total es el mximo de las columnas de la lista Columna de
resumen.
1 columna 2 columna. La columna total es la resta de las columnas de la lista Columna de
la segunda columna de la lista Columna de resumen. Esta lista debe contener, exactamente,
dos columnas.
Producto de columnas. La columna total es el producto de las columnas de la lista Columna de
resumen.
489
Informes de los resultados
Total final. Muestra y etiqueta un total global para cada columna que aparece al final de la columna.
Valores perdidos. Permite excluir los valores perdidos del informe o seleccionar un nico carcter
para indicar estos valores.
Mostrar funciones de resumen diferentes en las columnas de una nica lnea de resumen.
Insertar lneas de resumen en las columnas de datos para variables que no sean la variable de
la columna de datos o para diversas combinaciones (funciones compuestas) de las funciones
de resumen.
Insertar lneas en blanco despus de cada n-simo caso de los informes en formato de listado.
490
Captulo 41
Captulo
Anlisis de fiabilidad
42
El anlisis de fiabilidad permite estudiar las propiedades de las escalas de medicin y de los
elementos que componen las escalas. El procedimiento Anlisis de fiabilidad calcula un nmero
de medidas de fiabilidad de escala que se utilizan normalmente y tambin proporciona informacin
sobre las relaciones entre elementos individuales de la escala. Se pueden utilizar los coeficientes
de correlacin intraclase para calcular estimaciones de la fiabilidad inter-evaluadores.
Ejemplo. El cuestionario mide la satisfaccin del cliente de manera til? El anlisis de fiabilidad
le permitir determinar el grado en que los elementos del cuestionario se relacionan entre s,
obtener un ndice global de la replicabilidad o de la consistencia interna de la escala en su conjunto
e identificar elementos problemticos que deberan ser excluidos de la escala.
Estadsticos. Descriptivos para cada variable y para la escala, estadsticos de resumen comparando
Dos mitades. Este modelo divide la escala en dos partes y examina la correlacin entre
dichas partes.
Guttman. Este modelo calcula los lmites inferiores de Guttman para la fiabilidad verdadera.
Paralelo. Este modelo asume que todos los elementos tienen varianzas iguales y varianzas
Paralelo estricto. Este modelo asume los supuestos del modelo paralelo y tambin asume que
numricamente.
Supuestos. Las observaciones deben ser independientes y los errores no deben estar
correlacionados entre los elementos. Cada par de elementos debe tener una distribucin normal
bivariada. Las escalas deben ser aditivas, de manera que cada elemento est linealmente
relacionado con la puntuacin total.
Procedimientos relacionados. Si desea explorar la dimensionalidad de los elementos de la escala
492
Captulo 42
493
Anlisis de fiabilidad
Puede seleccionar diversos estadsticos que describen la escala y sus elementos. Los estadsticos
de los que se informa por defecto incluyen el nmero de casos, el nmero de elementos y las
estimaciones de la fiabilidad, segn se explica a continuacin:
Modelos Alfa. Coeficiente Alfa; para datos dicotmicos, ste es equivalente al coeficiente
20 de Kuder-Richardson (KR20).
Modelos Dos mitades. Correlacin entre formas, fiabilidad de dos mitades de Guttman,
fiabilidad de Spearman-Brown (longitud igual y desigual) y coeficiente alfa para cada mitad.
los casos.
Elemento. Genera estadsticos descriptivos para los elementos a travs de los casos.
elemento con la escala compuesta por otros elementos. Los estadsticos incluyen la media
de escala y la varianza si el elemento fuera a eliminarse de la escala, la correlacin entre el
elemento y la escala compuesta por otros elementos, y alfa de Cronbach si el elemento fuera
a eliminarse de la escala.
494
Captulo 42
mnimo y el promedio de las medias de los elementos, el rango y la varianza de las medias de
los elementos, y la razn de la mayor media sobre la menor media de los elementos.
concordancia de Kendall. Esta opcin es adecuada para datos que se encuentren en el formato
de rangos. La prueba de chi-cuadrado sustituye a la prueba F habitual en la tabla de ANOVA.
modelos disponibles son: Dos factores, efectos mixtos; Dos factores, efectos aleatorios y Un
factor, efectos aleatorios. Seleccione Dos factores, efectos mixtos, si los efectos de personas
son aleatorios y los efectos de elementos son fijos, Dos factores, efectos aleatorios, si los
efectos de personas y los efectos de elementos son aleatorios; o Un factor, efectos aleatorios si
los efectos de personas son aleatorios.
Tipo. Seleccione el tipo de ndice. Los tipos disponibles son: Los tipos disponibles son:
495
Anlisis de fiabilidad
Intervalo de confianza. Especifica el nivel para el intervalo de confianza. El valor por defecto
es 95%.
hiptesis. Este valor es el valor con el que se compara el valor observado. El valor por
defecto es 0.
Especificar una divisin distinta de la de dos mitades iguales, para el mtodo de dos mitades.
Captulo
Escalamiento multidimensional
43
estar medidas en la misma mtrica. Si los datos son datos multivariantes, las variables pueden
ser datos cuantitativos, binarios o de recuento. El escalamiento de las variables es un tema
importante, ya que las diferencias en el escalamiento pueden afectar a la solucin. Si las variables
tienen grandes diferencias en el escalamiento (por ejemplo, una variable se mide en dlares y
otra en aos), debe considerar la posibilidad de tipificarlas (este proceso puede llevarse a cabo
automticamente con el propio procedimiento Escalamiento multidimensional).
496
497
Escalamiento multidimensional
E En Distancias, seleccione Los datos son distancias o Crear distancias a partir de datos.
E Si los datos son distancias, seleccione al menos cuatro variables numricas para el anlisis.
(Tambin puede pulsar en Forma para indicar la forma de la matriz de distancias.)
E Si desea crear las distancias antes de analizarlas, seleccione al menos una variable numrica.
(Tambin puede pulsar en Medida para indicar el tipo de medida de distancia que desea.) Cada
variable de agrupacin puede ser numrica o de cadena, y puede crear matrices distintas para cada
categora de una variable de agrupacin moviendo dicha variable a la lista Matrices individuales
para.
498
Captulo 43
Si el conjunto de datos activo representa distancias entre uno o dos conjuntos de objetos,
especifique la forma de la matriz de datos para obtener los resultados correctos.
Nota: No puede seleccionar Cuadrada simtrica si el cuadro de dilogo Modelo especifica la
condicionalidad de filas.
499
Escalamiento multidimensional
Medida. Le permite especificar la medida de disimilaridad para el anlisis. Seleccione una opcin
del grupo Medida que se corresponda con el tipo de datos y, a continuacin, elija una de las
medidas de la lista desplegable correspondiente a ese tipo de medida. Las opciones disponibles
son:
o Personalizada.
distintas, puede que desee tipificar los valores antes de calcular las proximidades (no es aplicable a
datos binarios). Seleccione un mtodo de estandarizacin en la lista desplegable Estandarizar.
Si no se requiere ninguna estandarizacin, seleccione Ninguno.
Fila o Incondicional.
500
Captulo 43
Se calcula una solucin para cada nmero del rango especificado. Especifique nmeros enteros
entre 1 y 6; se permite un mnimo de 1 slo si selecciona Distancia eucldea como modelo de
escalamiento. Para una solucin nica, especifique el mismo nmero para el mnimo y el mximo.
Modelo de escalamiento. Permite especificar los supuestos bajo los que se realiza el escalamiento.
Las opciones disponibles son Distancia eucldea o Distancia eucldea de diferencias individuales
(tambin conocida como INDSCAL). Para el modelo de Distancia eucldea de diferencias
individuales, puede seleccionar Permitir ponderaciones negativas de los sujetos, si es adecuado
para los datos.
de grupo, Grficos para los sujetos individuales, Matriz de datos y Resumen del modelo y de las
opciones.
Criterios. Permite determinar cundo debe detenerse la iteracin. Para cambiar los valores por
Tratar distancias menores que n como perdidas. Las distancias menores que este valor se excluyen
del anlisis.
501
Escalamiento multidimensional
Utilizar tres tipos de modelos adicionales, conocidos como ASCAL, AINDS y GEMSCAL
en la bibliografa acerca del escalamiento multidimensional.
Captulo
Estadsticos de la razn
44
502
503
Estadsticos de la razn
Figura 44-1
Cuadro de dilogo Estadsticos de la razn
Si lo desea:
Seleccione una variable de agrupacin y especificar el orden de los grupos en los resultados.
Elija si desea guardar los resultados en un archivo externo para un uso posterior y especificar
el nombre del archivo en el que se van a guardar los resultados.
504
Captulo 44
Estadsticos de la razn
Figura 44-2
Cuadro de dilogo Estadsticos de la razn
Tendencia central. Las medidas de tendencia central son estadsticos que describen la distribucin
de las razones.
Mediana. Un valor tal que el nmero de razones menores que este valor es igual al nmero
Media. El resultado de sumar las razones y dividir la suma entre el nmero total de razones.
Media ponderada. El resultado de dividir la media del numerador entre la media del
media ponderada (si se solicita). Especifique un valor mayor o igual que 0 y menor que 100
como nivel de confianza.
Dispersin. Estos estadsticos miden la cantidad de variacin o de dispersin entre los valores
observados.
las razones respecto a la mediana y dividir el resultado entre el nmero total de razones.
505
Estadsticos de la razn
las razones respecto a la media, dividir la suma por el nmero total de razones menos uno y
extraer la raz cuadrada positiva.
Razones dentro del. En este caso, el intervalo se define de forma explcita especificando los
valores superior e inferior del intervalo. Introduzca valores para las proporciones superior e
inferior y pulse en Aadir para obtener un intervalo.
Razones en. En este caso, el intervalo se define de forma implcita al especificar el porcentaje
de la mediana. Introduzca un valor entre 0 y 100 y pulse en Aadir. El lmite inferior del
intervalo ser igual a (1 0.01 valor) mediana, y el lmite superior ser igual a (1 +
0.01 valor) mediana.
Captulo
45
Curvas COR
el pago de sus prstamos; por tanto, se desarrollan mtodos especiales para tomar estas decisiones.
Las curvas COR se pueden utilizar para evaluar el grado de acierto de estos mtodos.
Estadsticos. Es un rea situada bajo la curva COR con un intervalo de confianza y puntos de
coordenadas de la curva COR. Grficos: Curva COR.
Mtodos. Se puede calcular la estimacin del rea situado bajo la curva COR de forma paramtrica
o no paramtrica mediante un modelo exponencial binegativo.
Datos. Las variables de contraste son cuantitativas. Las variables de contraste suelen estar
constituidas por probabilidades, resultantes de un anlisis discriminante o de una regresin
logstica, o bien compuestas por puntuaciones atribuidas en una escala arbitraria que indican el
grado de conviccin que tiene un evaluador de que el sujeto pueda pertenecer a una u otra
categora. La variable de estado puede ser de cualquier tipo e indicar la categora real a la que
pertenece un sujeto. El valor de la variable de estado indica la categora que se debe considerar
positiva.
Supuestos. Se considera que los nmeros ascendentes de la escala del evaluador representan la
creciente conviccin de que el sujeto pertenece a una categora. Por el contrario, los nmeros
descendentes representan la creciente conviccin de que el sujeto pertenece a la otra categora. El
usuario deber elegir qu direccin es positiva. Tambin se considera que se conoce la categora
real a la que pertenece el sujeto.
Para obtener una curva COR
E En los mens, seleccione:
Analizar
Curva COR...
506
507
Curvas COR
Figura 45-1
Cuadro de dilogo Curva COR
508
Captulo 45
tpico del rea situada bajo la curva. Los mtodos disponibles son el no paramtrico y el
exponencial binegativo. Tambin se puede establecer el nivel para el intervalo de confianza. El
rango disponible es entre el 50,1% y el 99,9%.
Valores perdidos. Permite especificar el tratamiento que reciben los valores perdidos.
Captulo
46
Se pueden crear grficos de alta resolucin mediante los procedimientos del men Grficos y
mediante muchos de los procedimientos del men Analizar. Este captulo explica los conceptos
bsicos de la utilidad de grficos.
Generacin de grficos
El generador de grficos permite crear grficos a partir de los grficos predefinidos de la galera
o a partir de los elementos individuales (por ejemplo, ejes y barras). Puede crear un grfico
arrastrando y colocando los grficos de la galera o los elementos bsicos en el lienzo, que es la
zona grande situada a la derecha de la lista Variables del cuadro de dilogo Generador de grficos.
A medida que genere el grfico, el lienzo mostrar una presentacin preliminar del grfico.
Aunque la presentacin preliminar utiliza etiquetas de variable definidas y niveles de medida, no
muestra los datos reales. En su lugar, utiliza datos generados aleatoriamente para proporcionar un
esbozo aproximado de la apariencia del grfico.
El mtodo preferido por los nuevos usuarios es el uso de la galera. Si desea obtener informacin
acerca del uso de la galera, consulte Generacin de un grfico desde la galera el p. 510.
Para iniciar el generador de grficos
E En los mens, seleccione:
Grficos
Generador de grficos
510
Captulo 46
Figura 46-1
Cuadro de dilogo Generador de grficos
est disponible, en la zona de colocacin de agrupamiento. Si una zona de colocacin del eje ya
muestra un estadstico que desea utilizar, no tendr que arrastrar ninguna variable a la zona de
colocacin. Slo deber aadir una variable a la zona cuando el texto de la zona sea azul. Si el
texto es negro, la zona ya contiene una variable o un estadstico.
511
Conceptos bsicos de la utilidad de grficos
E Si necesita cambiar los estadsticos o modificar los atributos de los ejes o las leyendas (como la
amplitud de la escala), pulse en Propiedades del elemento.
512
Captulo 46
Figura 46-3
Cuadro de dilogo Propiedades del elemento
E En la lista Editar propiedades de, seleccione el elemento que desea cambiar. (Si desea obtener
informacin acerca de propiedades especficas, pulse en Ayuda.)
E Una vez realizados los cambios, pulse en Aplicar.
E Si necesita agregar ms variables al grfico (por ejemplo, para la agrupacin o la adicin de
paneles), pulse en la pestaa Grupos/ID de puntos del cuadro de dilogo Generador de grficos y
seleccione una o ms opciones. A continuacin, arrastre las variables categricas a las nuevas
zonas de colocacin que aparecen en el lienzo.
E Si desea transponer el grfico (por ejemplo, para que las barras sean horizontales), pulse en la
pestaa Elementos bsicos y, a continuacin, pulse en Transponer.
E Pulse en Aceptar para crear el grfico. Aparecer el grfico en el Visor.
513
Conceptos bsicos de la utilidad de grficos
Figura 46-4
Grfico de barras en la ventana Visor
Edicin de grficos
El Editor de grficos proporciona un entorno potente y fcil de usar en el que puede personalizar
sus grficos y explorar los datos. El Editor de grficos presenta:
Una interfaz de usuario sencilla e intuitiva. Puede seleccionar y editar partes del grfico
Unas herramientas de exploracin potentes. Puede explorar los datos de distintas maneras,
como puede ser mediante su etiquetado, reordenacin y rotacin. Puede cambiar los tipos
de grficos y las funciones de las variables en el grfico. Asimismo, puede aadir curvas de
distribucin y lneas de ajuste, interpolacin y referencia.
Puede crear plantillas personalizadas y utilizarlas para crear fcilmente grficos con el aspecto
y las opciones que desee. Por ejemplo, si desea contar siempre con una orientacin especfica
para las etiquetas de los ejes, puede especificar dicha orientacin en una plantilla y aplicar
sta a los dems grficos.
514
Captulo 46
Muchas de las acciones que puede realizar en el Editor de grficos se llevan a cabo con los
mens, sobre todo si va a aadir un elemento al grfico. Puede, por ejemplo, utilizar los mens
para aadir una lnea de ajuste a un diagrama de dispersin. Despus de aadir un elemento al
grfico, utilizar con frecuencia el cuadro de dilogo Propiedades para especificar las opciones
del elemento aadido.
515
Conceptos bsicos de la utilidad de grficos
o
E Seleccionar un elemento grfico y elegir a continuacin en los mens:
Edicin
Propiedades
El cuadro de dilogo Propiedades incluye una serie de pestaas que le permiten definir las
opciones y realizar otros cambios en el grfico. Las pestaas que puede ver en el cuadro de
dilogo Propiedades se basan en la seleccin actual.
Algunas pestaas incluyen una presentacin preliminar que le permite hacerse una idea de
cmo los cambios afectarn a la seleccin al aplicarlos. No obstante, el grfico en s no reflejar
los cambios hasta que pulse en Aplicar. Puede realizar cambios en ms de una pestaa antes de
pulsar en Aplicar. Si desea cambiar la seleccin para modificar un elemento diferente del grfico,
pulse en Aplicar antes de cambiar la seleccin. Si no pulsa en Aplicar antes de cambiar la seleccin,
516
Captulo 46
al pulsar en Aplicar ms adelante, los cambios slo se aplicarn en el elemento o los elementos
que estn seleccionados actualmente.
Segn la seleccin, slo estarn disponibles algunos ajustes. La ayuda para cada una de las
pestaas especifica lo que debe seleccionar para ver las pestaas. Si se han seleccionado varios
elementos, slo puede cambiar aquellos ajustes que sean comunes a todos los elementos.
Barras de herramientas
Las barras de herramientas proporcionan mtodos abreviados para algunas de las funcionalidades
del cuadro de dilogo Propiedades. Por ejemplo, en vez de utilizar la pestaa Texto del cuadro
de dilogo Propiedades, puede utilizar la barra de herramientas Editar para cambiar la fuente
y el estilo del texto.
Almacenamiento de cambios
al pie.
Para eliminar un ttulo o una nota al pie
E Pulse en la pestaa Ttulos/notas al pie.
E Anule la seleccin del ttulo o de la nota al pie que desea eliminar.
517
Conceptos bsicos de la utilidad de grficos
Al aadir ttulos y notas al pie, no es posible editar directamente el texto asociado en el grfico. Al
igual que ocurre con otros elementos del generador de grficos, la edicin se realiza mediante el
cuadro de dilogo Propiedades del elemento.
E Pulse en Propiedades del elemento si no aparece el cuadro de dilogo Propiedades del elemento.
E En la lista Editar propiedades de, seleccione un ttulo, subttulo o nota al pie (por ejemplo, Ttulo 1).
E En el cuadro Contenido, escriba el texto asociado con el ttulo, subttulo o nota al pie.
E Pulse en Aplicar.
categoras o subgrupos, seleccione Incluir para que la categora o categoras de los valores perdidos
definidos por el usuario (valores identificados como perdidos por el usuario) se incluyan en
el grfico. Estas categoras perdidos tambin actan como variables de segmentacin para
calcular el estadstico. La categora o categoras perdidos aparecen en el eje de categoras o en
la leyenda, aadiendo, por ejemplo, una barra adicional o un sector a un grfico de sectores. Si no
hay ningn valor perdido, no aparecern las categoras perdidos.
Si selecciona esta opcin y quiere suprimir la presentacin despus de que se dibuje el grfico,
abra el grfico en el Editor de grficos y, a continuacin, seleccione Propiedades en el men
Edicin. Utilice la pestaa Categoras para mover las categoras que desea suprimir a la lista
Excluidos. Sin embargo, tenga en cuenta que los estadsticos no se vuelven a calcular si oculta
las categoras perdidos. As, algo parecido a un porcentaje estadstico tendr en cuenta las
categoras perdidos.
Nota: este control no afecta a los valores perdidos del sistema. Siempre estn excluidos del grfico.
518
Captulo 46
Estadsticos de resumen y valores de casos. Puede seleccionar una de las siguientes alternativas
para la exclusin de casos con valores perdidos:
Excluir segn lista para obtener una base de casos coherente para el grfico. Si alguna de las
variables del grfico tiene un valor perdido para un determinado caso, se excluir el caso
completo del grfico.
Excluir por variable para maximizar el uso de los datos. Si una variable seleccionada tiene
algn valor perdido, los casos que tengan estos valores perdidos se excluirn al analizar
dicha variable.
Para ver la diferencia existente entre la exclusin por lista y la exclusin por variables de los
valores perdidos, observe las siguientes figuras, que muestran un grfico de barras para cada una
de las dos opciones.
Figura 46-7
Exclusin por lista de los valores perdidos
Figura 46-8
Exclusin por variables de los valores perdidos
Los datos incluyen algunos valores perdidos por el sistema (en blanco) en las variables de Salario
actual y Categora laboral. En otros casos, se introdujo el valor 0 y se defini como perdido. En
ambos grficos, se ha seleccionado la opcin Mostrar los grupos definidos por los valores perdidos,
519
Conceptos bsicos de la utilidad de grficos
que aade la categora Perdidos al resto de las categoras laborales mostradas. En cada grfico, los
valores de la funcin de resumen, Nmero de casos, se muestran en las etiquetas de las barras.
En ambos grficos, 26 casos tienen un valor perdido del sistema para la categora laboral y
13 casos tienen el valor perdido definido por el usuario (0). En el grfico por lista, el nmero de
casos es el mismo para ambas variables en cada agrupacin de barras ya que siempre que haba un
valor perdido se excluy el caso de todas las variables. En el grfico por variables, el nmero
de casos no perdidos de cada variable de una categora se representa sin tener en cuenta los
valores perdidos en las otras variables.
Plantillas
La plantilla de grficos permite aplicar los atributos de un grfico a otro. Cuando abre un grfico
en el Editor de grficos, puede guardarlo como una plantilla. A continuacin, puede aplicar esa
plantilla especificndolo durante la creacin, o ms tarde, aplicndola en el Editor de grficos.
Plantilla por defecto. sta es la plantilla especificada por Opciones. Para acceder a estas opciones
seleccione Opciones en el men Edicin del Editor de datos y, a continuacin, pulse en la pestaa
Grficos. La plantilla por defecto se aplica primero, lo que significa que las otras plantillas
pueden omitirla.
Archivos de plantilla. Pulse en Aadir para especificar una o ms plantillas con el cuadro de dilogo
estndar de seleccin de archivos. Se aplican en orden de aparicin. As, las plantillas situadas al
final de la lista pueden omitir las plantillas del inicio de la lista.
Paneles y tamao de los grficos
Tamao del grfico. Especifique un porcentaje mayor que 100 para ampliar el grfico o menor que
100 para reducirlo. El porcentaje es relativo al tamao del grfico por defecto.
Paneles. Cuando hay numerosas columnas de panel, seleccione Ajustar paneles para que los
paneles se ajusten en varias filas en vez de obligar a que encajen en una determinada fila. A menos
que esta opcin est seleccionada, los paneles estn ajustados para ajustarse a una fila.
Captulo
47
Utilidades
En este captulo se describen las funciones del men Utilidades as como la posibilidad de
reordenar las listas de variables de destino.
Etiqueta de variable
Formato de datos
Etiquetas de valor
Nivel de medida
Figura 47-1
Cuadro de dilogo Variables
Visible. La columna Visible de la lista de variables indica si la variable est visible actualmente en
el Editor de datos y en las listas de variables del cuadro de dilogo. La visibilidad est controlada
por conjuntos de variables. Si desea obtener ms informacin, consulte Conjuntos de variables
el p. 521.
Ir a. Se dirige a la variable seleccionada en el Editor de datos.
Pegar. Pega las variables seleccionadas en la posicin del cursor en la ventana de sintaxis
designada.
520
521
Utilidades
Para modificar la definicin de una variable, utilice la Vista de variables en el Editor de datos.
Para obtener informacin sobre la variable
E En los mens, seleccione:
Utilidades
Variables...
E Seleccione la variable cuya informacin de definicin desee mostrar.
Los comentarios admiten cualquier longitud, aunque estn limitados a 80 bytes (por regla general,
80 caracteres en idiomas de un solo byte) por lnea; las lneas se dividen automticamente en 80
caracteres. Los comentarios se muestran en la misma fuente que los resultados de texto para
reflejar de forma precisa el modo en que aparecen al mostrarlos en el Visor.
Se aade de forma automtica una anotacin de fecha (la fecha actual entre parntesis) al final
de la lista de comentarios siempre que se aaden o modifican los comentarios. Esto puede dar
lugar a cierta ambigedad por lo que respecta a las fechas asociadas a los comentarios si modifica
un comentario existente o introduce un comentario nuevo entre los comentarios existentes.
Conjuntos de variables
Puede restringir las variables que aparecen en el Editor de datos y en las listas de variables de
los cuadros de dilogo definiendo y utilizando conjuntos de variables. Es especialmente til en
archivos de datos con un amplio nmero de variables. Los conjuntos de variables pequeos hacen
que la bsqueda y la seleccin de variables para los anlisis sea ms fcil.
522
Captulo 47
Figura 47-2
Cuadro de dilogo Definir conjuntos de variables
Nombre del conjunto. Los nombres de los conjuntos pueden tener hasta 64 bytes. Puede utilizarse
523
Utilidades
Figura 47-3
Cuadro de dilogo Utilizar conjuntos de variables
El conjunto de variables que aparece en el Editor de datos y en las listas de variables de los
cuadros de dilogo es la unin de todos los conjuntos seleccionados.
Aunque los conjuntos de variables definidos se guardan en los archivos de datos SPSS
Statistics, la lista de conjuntos seleccionados se restablece en los conjuntos por defecto
preincorporados cada vez que se abre el archivo de datos.
La lista de conjuntos de variables disponibles incluye todos los conjuntos de variables definidos
para el conjunto de datos activo, ms dos conjuntos preincorporados:
ALLVARIABLES. Este conjunto contiene todas las variables del archivo de datos, incluidas las
NEWVARIABLES. Este conjunto contiene slo las nuevas variables creadas durante la sesin.
Nota: Incluso si guarda el archivo de datos tras crear las nuevas variables, estas nuevas
variables seguirn incluidas en el conjunto NEWVARIABLES hasta que cierre y vuelva a
abrir el archivo de datos.
Es necesario seleccionar como mnimo un conjunto de datos. Si se selecciona ALLVARIABLES,
ninguno de los conjuntos seleccionados tendr ningn efecto visible, ya que este conjunto incluye
todas las variables.
Para seleccionar los conjuntos de variables que desea mostrar
E En los mens, seleccione:
Utilidades
Usar conjuntos de variables...
524
Captulo 47
E Seleccione los conjuntos de variables definidos que contengan las variables que desee incluir en el
Captulo
48
Opciones
Controla una gran variedad de opciones, entre ellas:
El diario de la sesin, que guarda un registro de todos los comandos ejecutados en cada sesin
El orden en que aparecen las variables en las listas de origen de los cuadros de dilogo
525
526
Captulo 48
General: Opciones
Figura 48-1
Cuadro de dilogo Opciones: pestaa General
Listas de variables
Estos ajustes controlan la presentacin de las variables en las listas de los cuadros de dilogo. Es
posible mostrar los nombres o las etiquetas de las variables. Estos nombres o etiquetas pueden
presentarse por orden alfabtico o por orden de archivo, o agruparse por nivel de medida. El orden
de presentacin afecta slo a las listas de variables de origen. Las listas de variables de destino
siempre reflejan el orden en el que las variables han sido seleccionadas.
Ventanas
Aspecto. Controla el aspecto bsico de las ventanas y cuadros de dilogo.
Abrir una ventana de sintaxis al inicio. Las ventanas de sintaxis son ventanas de archivos de texto
que sirven para introducir, editar y ejecutar comandos. Si utiliza con frecuencia la sintaxis de
comandos, seleccione esta opcin para abrir automticamente una ventana de sintaxis al principio
de cada sesin. Esta opcin es especialmente til para los usuarios avanzados que prefieren
trabajar con la sintaxis de comandos en vez de con los cuadros de dilogo.
527
Opciones
Abrir slo un conjunto de datos cada vez. Cierra el origen de datos abierto actualmente cada vez
que se abre uno nuevo a travs de los mens y cuadros de dilogo. Por defecto, cada vez que se
abre un nuevo origen de datos a travs de los mens y cuadros de dilogo, se abre una nueva
ventana Editor de datos y los orgenes de datos que ya estn abiertos en ventanas Editor de datos
permanecen abiertos y disponibles durante la sesin hasta que se cierran de forma explcita.
Cuando se selecciona esta opcin, tiene efecto de forma inmediata pero no se cierran los conjuntos
de datos que ya estaban abiertos antes de cambiarla. Este ajuste no tiene efecto sobre los orgenes
de datos abiertos mediante la sintaxis de comandos, que se basa en comandos DATASET para
controlar varios conjuntos de datos.Si desea obtener ms informacin, consulte Trabajo con
varios orgenes de datos en Captulo 6 el p. 101.
Codificacin de caracteres para archivos de datos y archivos de sintaxis
Controla el comportamiento por defecto para determinar la codificacin para leer y escribir
archivos de datos y archivos de sintaxis. Esta opcin slo se puede seleccionar cuando no hay
ningn origen de datos abierto y permanece en vigor durante las sesiones posteriores hasta que se
cambie de forma explicita.
Unicode (conjunto de caracteres universal). Utiliza la codificacin Unicode (UTF-8) para leer
Los archivos de datos con SPSS Statistics y los archivos de sintaxis, guardados con una
codificacin Unicode, no se deben utilizar en las versiones de SPSS Statistics anteriores a la
16.0. En el caso de los archivos de sintaxis, se puede especificar la codificacin al guardar
el archivo.Si se trata de archivos de datos, deber abrir el archivo en el modo de pgina de
cdigo y volver a guardarlo si desea leerlo con versiones anteriores.
Cuando los archivos de datos de pgina de cdigo se leen en el modo Unicode, el ancho
definido de todas las variables de cadena se triplica. Para establecer de forma automtica la
longitud de cada variable de cadena en el valor ms largo observado para dicha variable,
seleccione Minimizar longitudes de cadena en funcin de los valores observados en el cuadro de
dilogo Abrir datos.
Resultados
No usar notacin cientfica para nmeros pequeos en tablas. Suprime la presentacin de la
notacin cientfica para valores decimales pequeos en el resultado. Los valores decimales muy
pequeos se muestran como 0 (o 0,000).
Sistema de medida. El sistema de medida utilizado (puntos, pulgadas o centmetros) para
especificar atributos tales como los mrgenes de casillas de las tablas pivote, los anchos de casilla
y el espacio entre las tablas para la impresin.
528
Captulo 48
Idioma. Determina el idioma que se utiliza para los resultados. No se aplica a resultados en
formato de slo texto. Esta lista de idiomas disponibles depende de los archivos de idioma que
estn instalados actualmente. (Nota: Esto no afecta al idioma de la interfaz de usuario.)
Nota: Es posible que, en los procesos personalizados que se basan en cadenas de texto de un
idioma especfico, estas cadenas no se ejecuten correctamente cuando se cambie el idioma de los
resultados. Si desea obtener ms informacin, consulte Procesos: Opciones el p. 541.
Notificacin. Determina cmo debe notificar el programa al usuario que ha finalizado la ejecucin
de un procedimiento y que los resultados estn disponibles en el Visor.
Interfaz de usuario
Esto controla el idioma utilizado en los mens, cuadros de dilogo y otros elementos de la interfaz
de usuario. (Nota: Esto no afecta al idioma de los resultados.)
529
Opciones
Estado inicial de los resultados. Controla los elementos que se muestran y se ocultan
automticamente cada vez que se ejecuta un procedimiento, adems de la alineacin inicial de los
elementos. Puede controlar la presentacin de los siguientes elementos: registro, advertencias,
notas, ttulos, tablas pivote, grficos, diagramas de rbol y resultados de texto Tambin se puede
activar o desactivar la muestra de los comandos en el registro. Si lo desea, puede copiar la sintaxis
de comandos del registro y guardarla en un archivo de sintaxis.
Nota: Todos los elementos de resultados aparecen alineados a la izquierda en el Visor. Las
selecciones de justificacin slo afectarn a la alineacin de los resultados impresos. Los
elementos con alineacin centrada y a la derecha se identifican por un pequeo smbolo situado
encima y a la izquierda del elemento.
Ttulo. Controla el estilo, el tamao y el color de la fuente de los nuevos ttulos de resultados.
Ttulo de pgina. Controla el estilo, tamao y color de la fuente para los nuevos ttulos de pginay
los ttulos de pgina generados por la sintaxis de comandos TITLE y SUBTITLE o creados por
Nuevo ttulo de pgina en el men Insertar.
Resultados de texto. Fuente utilizada para los resultados de texto. Los resultados de texto se han
diseado para utilizarlos con fuentes de paso fijo. Si selecciona una fuente proporcional, los
resultados tabulares no se alinearn adecuadamente.
Datos: Opciones
Figura 48-3
Cuadro de dilogo Opciones: pestaa Datos
530
Captulo 48
Opciones de transformacin y fusin. Cada vez que SPSS ejecuta un comando, lee el archivo de
datos. Algunas transformaciones de datos (tales como Calcular y Recodificar) no requieren una
lectura diferente de los datos; esto permite postergar su ejecucin hasta que el programa lea los
datos para ejecutar otro comando, como puede ser un procedimiento estadstico.
Para archivos de datos grandes, donde puede llevar tiempo la lectura de los datos, puede
seleccionar Calcular los valores antes usarlos para retrasar la ejecucin y ahorrar tiempo de
procesamiento. Cuando se selecciona esta opcin, los resultados de las transformaciones
realizadas mediante los cuadros de dilogo, como Calcular variable no se mostrarn
inmediatamente en el Editor de datos; las nuevas variables creadas por transformaciones
se mostrarn sin valores de datos y los valores de datos del Editor de datos no se podrn
modificar mientras haya transformaciones pendientes. Cualquier comando que lea los datos,
como el procedimiento estadstico o de creacin de grficos, ejecutar las transformaciones
pendientes y actualizar los datos que se muestran en el Editor de datos. Si lo desea, puede
utilizar Ejecutar transformaciones pendientes en el men Transformar.
Con el valor por defecto Calcular los valores inmediatamente, cuando pega la sintaxis de
comandos de los cuadros de dilogo, se copiar un comando EXECUTE despus de cada
comando de transformacin. Si desea obtener ms informacin, consulte Varios comandos
Ejecutar en Captulo 13 el p. 283.
Formato de presentacin para las nuevas variables numricas. Controla la presentacin por defecto
del ancho y el nmero de posiciones decimales de las nuevas variables numricas. No existe
formato de presentacin por defecto para las nuevas variables de cadena. Si un valor es demasiado
largo para el formato de presentacin especificado, primero se redondean las posiciones decimales
y despus los valores se convierten a notacin cientfica. Los formatos de presentacin no afectan
a los valores de datos internos. Por ejemplo, el valor 123456,78 se puede redondear a 123457 para
la presentacin, pero se utilizar el valor original sin redondear en cualquier clculo.
Definir rango de siglo para aos de dos dgitos. Define el rango de aos para las variables con
formato de fecha introducidas o mostradas con un ao de dos dgitos (por ejemplo, 10/28/86,
29-OCT-87). La opcin de rango automtico se basa en el ao actual; es decir, comienza 69
aos antes del actual y finaliza 30 aos despus (sumando el ao en curso hace un total de 100
aos). En el rango personalizado, el ao final se establece de forma automtica en funcin del
valor introducido en el ao inicial.
Generador de nmeros aleatorios. Hay dos generadores de nmeros aleatorios disponibles:
531
Opciones
numrica para clasificarla como variable de escala o nominal. Las variables con un nmero de
valores nicos inferior al especificado se clasificarn como nominales.
Valores numricos de redondeo y truncacin. Para las funciones RND y TRUNC, estos controles de
ajustes que definen el umbral predefinido para redondear los valores que estn muy cercanos a un
lmite de redondeo. Este ajuste se especifica como un nmero de bits y se define como 6 en el
momento de la instalacin, que debe ser suficiente para la mayora de las aplicaciones. Si define el
nmero de bits a 0 produce los mismos resultados que en la versin 10. Si define el nmero de bits
a 10 produce los mismos resultados que en las versiones 11 y 12.
Para la funcin RND, este ajuste especifica el nmero de los bits menos significativos para
los que el valor se redondear, que puede reducir el umbral de redondeo, pero se seguir
redondeando. Por ejemplo, si redondea un valor entre 1,0 y 2,0 al entero ms cercano, este
ajuste especifica cunto podr reducir el valor de 1,5 (el umbral de redondeo hasta 2,0) y
podr redondearse a 2,0.
Para la funcin TRUNC, este ajuste especifica el nmero de los bits menos significativos para
los que el valor se truncar, que puede reducir el umbral de truncacin, pero se redondear
antes de truncarse. Por ejemplo, si se trunca un valor entre 1,0 y 2,0 al entero ms cercano,
este ajuste especifica cunto podr reducir el valor de 2,0 y podr redondearse a 2,0.
Personalizar Vista de variables. Controla la presentacin por defecto y el orden de los atributos
532
Captulo 48
Figura 48-4
Personalizar Vista de variables (por defecto).
de los atributos.
Moneda: Opciones
Puede crear hasta cinco formatos de presentacin de moneda personalizados que pueden incluir
caracteres de prefijo y sufijo especiales adems de un tratamiento especial para los valores
negativos.
Los nombres de los cinco formatos de moneda personalizados son MPA, MPB, MPC, CCD y
MPE. No se pueden cambiar los nombres de los formatos ni aadir otros nuevos. Para modificar
un formato de moneda personalizado, seleccione el nombre del formato de la lista de origen y
realice los cambios que desee.
533
Opciones
Figura 48-5
Cuadro de dilogo Opciones: pestaa Moneda
Los prefijos, los sufijos y los separadores decimales definidos para los formatos monetarios
personalizados slo afectan a la presentacin en la pantalla. No es posible introducir valores en el
Editor de datos utilizando caracteres de moneda personalizados.
534
Captulo 48
Etiquetas descriptivas de variable y de valor (Vista de variables del Editor de datos, columnas
de Etiqueta y Valores) a menudo facilitan la interpretacin de los resultados. Sin embargo, las
etiquetas largas pueden crear dificultades en algunas tablas.
Figura 48-6
Cuadro de dilogo Opciones: pestaa Etiquetas de los resultados
Las opciones de etiquetas de los resultados afectan slo a los nuevos resultados que se producen
despus de cambiar las selecciones. A los resultados que ya se muestran en el Visor no les afectan
los cambios en la configuracin. Esta configuracin slo afecta a los resultados de las tablas
pivote. Los resultados de texto no se vern afectados por estas selecciones.
535
Opciones
Opciones de grfico
Figura 48-7
Cuadro de dilogo Opciones: pestaa Grficos
Plantilla grfica. Los grficos nuevos pueden utilizar tanto las opciones seleccionadas aqu, como
las opciones de un archivo de plantilla grfica. Pulse en Examinar para seleccionar un archivo de
plantilla grfica. Para crear un archivo de plantilla grfica, cree un grfico con los atributos que
desee y gurdelo como una plantilla (seleccione Guardar plantilla grfica en el men Archivo).
Relacin de aspecto de los grficos. La relacin ancho-alto del marco exterior de los nuevos
grficos. Puede especificar una relacin ancho-alto entre los valores 0,1 y 10,0. Los valores
inferiores a 1 generan grficos que son ms altos que anchos. Los valores mayores que 1 producen
grficos que son ms anchos que altos. Un valor de 1 produce un grfico cuadrado. Una vez
creado un grfico, no es posible cambiar su relacin de aspecto.
Especificaciones actuales. Entre los ajustes disponibles se incluyen:
grficos. Mostrar sucesivamente slo los colores utiliza nicamente colores para diferenciar
los elementos grficos y no utiliza tramas. Mostrar sucesivamente slo las tramas slo utiliza
estilos de lnea, smbolos de marcador o tramas de relleno para diferenciar los elementos
grficos y no utiliza color.
536
Captulo 48
Marco. Controla la presentacin de los marcos interno y externo en los nuevos grficos.
para los grficos nuevos. Puede cambiar el orden de los colores o tramas utilizados al crear un
grfico nuevo.
sin categoras.
E Seleccione Grficos agrupados para cambiar el ciclo de color de los grficos con categoras. Para
cambiar el color de una categora, seleccinela y elija un color en la paleta para dicha categora.
Si lo desea, puede:
537
Opciones
categoras. Para cambiar el estilo de lnea de una categora, seleccinela y elija un estilo de
lnea en la paleta para dicha categora.
Si lo desea, puede:
538
Captulo 48
Si crea, por ejemplo, un grfico de barras agrupadas con dos grupos y selecciona Mostrar
sucesivamente slo las tramas en el cuadro de dilogo principal Opciones de grfico, los dos
primeros estilos de la lista Grficos agrupados se utilizan como tramas de relleno de barra en el
nuevo grfico.
Para cambiar el orden en que se utilizan los estilos de relleno
E Seleccione Grficos simples y, a continuacin, seleccione una trama de relleno utilizada para
cambiar la trama de relleno de una categora, seleccinela y elija una trama de relleno en la
paleta para dicha categora.
Si lo desea, puede:
539
Opciones
Figura 48-8
Cuadro de dilogo Opciones: pestaa Tablas pivote
Aspecto de tabla. Seleccione un aspecto de tabla en la lista de archivos y pulse en Aceptar o Aplicar.
Puede utilizar uno de los aspectos de tabla que se incluyen en SPSS Statistics, o bien crear uno
propio en el editor de tablas pivote (men Formato, Aspectos de tabla).
Nota: los aspectos de tabla creados en versiones anteriores de SPSS Statistics no se pueden
utilizar en la versin 16.0 o posterior.
Anchura de columnas. Controla el ajuste automtico de los anchos de columna en las tablas pivote.
Ajustar etiquetas y datos excepto en tablas extremadamente grandes. Para tablas que no superan
las 10.000 celdas, ajusta el ancho de columna al ms anchode entre la etiqueta de columna
y el mayor de los valores de los datos. Para tablas que superan las 10.000 celdas, ajusta el
ancho de columna al ancho de la etiqueta de la columna.
Ajustar slo para etiquetas. Ajusta el ancho de columna al ancho de la etiqueta de la columna.
Da lugar a tablas ms compactas, pero los valores de los datos ms anchos que la etiqueta
no se truncarn.
columna y el mayor de los valores de los datos. As se generan tablas ms anchas, pero se
asegura que se mostrarn todos los valores.
540
Captulo 48
Modo de edicin por defecto. Controla la activacin de las tablas pivote en la ventana del Visor
o en una ventana independiente. Por defecto, cuando se pulsa dos veces en una tabla pivote, se
activan todas las tablas en la ventana del Visor, excepto las que son muy grandes. Puede elegir
entre activar las tablas pivote en una ventana independiente o seleccionar una opcin de tamao
que abra las tablas pivote ms pequeas en la ventana del Visor y las ms grandes en una ventana
independiente.
Copia de tablas anchas en el portapapeles en formato de texto enriquecido. Cuando se pegan tablas
pivote en formato Word/RTF, las tablas que son demasiado anchas para el ancho del documento se
ajustarn, reducirn su escala para adaptarse al ancho del documento o permanecern inalteradas.
541
Opciones
comienzo de cada sesin. Puede especificar ubicaciones por defecto distintas para los archivos
de datos y el resto de archivos (que no sean de datos).
ltima carpeta utilizada. La ltima carpeta utilizada para abrir o guardar archivos en la sesin
anterior es la que se utiliza por defecto al comienzo de la siguiente sesin. Se aplica tanto a
los archivos de datos como al resto de archivos (que no sean de datos).
Estos ajustes slo se aplican a los cuadros de dilogo para abrir o guardar archivos y la ltima
carpeta utilizada est determinada por el ltimo cuadro de dilogo que se utiliz para abrir o
guardar un archivo. Los archivos abiertos o guardados a travs de la sintaxis de comandos no
tienen efecto en estos ajustes, ni se ven afectados por ellos. Estos ajustes slo estn disponibles en
el modo de anlisis local. En el anlisis en modo distribuido con un servidor remoto (requiere
SPSS Statistics Server), no puede controlar las ubicaciones de la carpeta de inicio.
Diario de la sesin
Puede utilizar el diario de la sesin para registrar automticamente los comandos ejecutados en
cada sesin. Incluye comandos introducidos y ejecutados en ventanas de sintaxis y comandos
generados por elecciones de cuadros de dilogo. Puede editar este archivo y volver a utilizar los
comandos en otras sesiones. Puede activar o desactivar el registro de sesin, aadir o sustituir
el archivo diario y seleccionar el nombre y la ubicacin del mismo. Si lo desea, puede copiar la
sintaxis de comandos del archivo de diario y guardarla en un archivo de sintaxis.
Carpeta temporal
Especifica la ubicacin de los archivos temporales creados durante una sesin. En el anlisis en
modo distribuido (disponible con la versin de servidor), esto no afecta a la ubicacin de los
archivos de datos temporales. En el modo distribuido, la ubicacin de los archivos de datos
temporales est controlada por la variable de entorno SPSSTMPDIR, la cual se puede definir slo
en el ordenador que ejecuta la versin del servidor del software. Si necesita cambiar la ubicacin
del directorio temporal, pngase en contacto con el administrador del sistema.
Lista de archivos utilizados recientemente
Procesos: Opciones
Utilice la pestaa Procesos para especificar el lenguaje de procesos por defecto y los autoprocesos
que desea utilizar. Puede utilizar procesos para automatizar muchas funciones, incluyendo
la personalizacin de tablas pivote.
542
Captulo 48
Figura 48-10
Cuadro de dilogo Opciones: pestaa Procesos
Nota: los usuarios del antiguo Sax Basic debern convertir manualmente los autoprocesos
personalizados. Los autoprocesos instalados con versiones anteriores a la 16.0 estn disponibles
como un conjunto independiente de archivos de procesos ubicado en el subdirectorio Samples
del directorio donde se ha instalado SPSS Statistics. Por defecto, ningn elemento de resultados
est asociado con los autoprocesos. Deber asociar manualmente todos los autoprocesos a los
elementos de resultados deseados, tal como se describe a continuacin.
Lenguaje de procesos por defecto. Esta opcin determina el editor de procesos que se ejecuta
cuando se crean nuevos procesos. Tambin especifica el lenguaje por defecto cuyo ejecutable
se utilizar para ejecutar autoprocesos. Los lenguajes de procesos disponibles dependen de
la plataforma. Para Windows, los lenguajes de procesos disponibles son Basic, instalado
con el sistema Base, y el lenguaje de programacin Python. Para el resto de plataformas, el
procesamiento est disponible con el lenguaje de programacin Python.
Nota: Para activar la ejecucin de procesos en lenguaje de programacin Python, deber instalar
por separado Python y el complemento de integracin SPSS Statistics-Python. El lenguaje de
programacin Python no se instala junto con el sistema Base, pero est disponible en complemento
de integracin SPSS Statistics-Python, que puede encontrarse en el CD de instalacin de todas
las plataformas..
Permitir el autoproceso. Esta casilla de verificacin permite activar o desactivar el
543
Opciones
Autoproceso bsico. Proceso opcional que se aplica a todos los objetos nuevos del Visor antes de
la aplicacin de cualquier otro autoproceso. Especifique el archivo de procesos que se utilizar
como autoproceso bsico y el lenguaje cuyo ejecutable se utilizar para ejecutar el proceso.
Para aplicar autoprocesos a los elementos de resultados
E En la cuadrcula Identificadores de comandos, elija un comando que genere elementos de
Pulse en la correspondiente casilla Proceso. Escriba la ruta al proceso o pulse en el botn con
puntos suspensivos (...) para buscar el proceso.
E Especifique el lenguaje cuyo ejecutable se utilizar para ejecutar el proceso. Nota: el lenguaje
544
Captulo 48
545
Opciones
Configuracin de Autocompletar
de manera predeterminada. El panel de navegacin contiene una lista de todos los comandos
reconocidos en la ventana de sintaxis, indicados en el orden en el que tienen lugar. Si pulsa un
comando del panel de navegacin, colocar el cursor al inicio del comando.
Abrir automticamente el panel Seguimiento de errores cuando se encuentren errores. Esto especifica
546
Captulo 48
La pestaa Imputaciones mltiples controla dos tipos de preferencias relacionadas con las
imputaciones mltiples:
Aspecto de datos imputados. De manera predeterminada, las casillas que contienen datos
imputados tendrn un color de fondo diferente que las casillas con datos no imputados. El aspecto
distintivo de los datos imputados debera facilitarle el desplazamiento por un conjunto de datos y
la localizacin de estas casillas. Puede cambiar el color de fondo predeterminado de las casillas, la
fuente y hacer que los datos imputados aparezcan en negrita.
Resultados. Este grupo controla el tipo de resultados del Visor producidos cuando se analiza
547
Opciones
Captulo
49
Puede personalizar los mens utilizando el Editor de mens. Con el Editor de mens es posible:
Aadir elementos de men que ejecuten otras aplicaciones y enven los datos automticamente
a otras aplicaciones.
Puede enviar datos a otras aplicaciones en los siguientes formatos: SPSS Statistics, Excel, Lotus
1-2-3, delimitado por tabuladores y dBASE IV.
Para aadir elementos a los mens
E En los mens, seleccione:
Ver
Editor de mens...
E En el cuadro de dilogo Editor de mens, pulse dos veces (o pulse en el icono del signo ms) en el
548
549
Personalizacin de mens y barras de herramientas
Figura 49-1
Cuadro de dilogo Editor de mens
Tambin se pueden aadir mens completamente nuevos y separadores entre los elementos
de men. Si lo desea, puede enviar automticamente el contenido del Editor de datos a otra
aplicacin cuando seleccione esa aplicacin en el men.
550
Captulo 49
Figura 49-2
Cuadro de dilogo Mostrar barras de herramientas
en esa categora.
E Arrastre y suelte las herramientas que desee en la barra de herramientas que aparece en el cuadro
de dilogo.
E Para eliminar una herramienta de la barra de herramientas, arrstrela a cualquier punto fuera de
551
Personalizacin de mens y barras de herramientas
Las nuevas herramientas se muestran en la categora Personales , que adems contiene los
elementos de men definidos por el usuario.
552
Captulo 49
Figura 49-4
Cuadro de dilogo Personalizar barra de herramientas
Las imgenes deben ser cuadradas. Las imgenes no cuadradas se recortan hasta formar un
cuadrado.
El tamao de las imgenes se ajusta automticamente. Para una visualizacin ptima, utilice
imgenes de 16x16 pxeles para imgenes pequeas de la barra de herramientas, o de 32x32
pxeles para imgenes grandes.
553
Personalizacin de mens y barras de herramientas
Figura 49-5
Cuadro de dilogo Crear nueva herramienta
Captulo
50
Crear una interfaz de usuario que genere una sintaxis de comandos para un comando de
extensin. Los comandos de extensin son comandos de SPSS Statistics definidos por el
usuario que se implementan en el lenguaje de programacin Python o R. Si desea obtener
ms informacin, consulte Cuadros de dilogo personalizados para comandos de extensin
el p. 577.
554
555
Creacin y gestin de cuadros de dilogo personalizados
Lienzo
El lienzo es la zona del generador de cuadros de dilogo personalizados donde puede disear
el diseo de su cuadro de dilogo.
Panel Propiedades
556
Captulo 50
el cuadro de dilogo y la ubicacin del nuevo elemento de men del cuadro de dilogo en los
mens de SPSS Statistics. Si desea obtener ms informacin, consulte Propiedades de cuadro
de dilogo el p. 556.
E Especificar los controles, como las listas de variables de origen y objetivo, que conforman el
especifica un nombre nico para asociarlo al cuadro de dilogo. Es el nombre que se utiliza para
identificar el cuadro de dilogo al instalarlo o desinstalarlo. Para reducir el riesgo de que los
nombres coincidan, puede aadir al nombre del cuadro de dilogo un prefijo que identifique su
organizacin, como una URL.
Ubicacin de men. Pulse en el botn de puntos suspensivos (...) para abrir el cuadro de dilogo
Ubicacin de men, que le permite especificar el nombre y ubicacin del elemento de men del
cuadro de dilogo personalizado. Si aade una ubicacin de men para un nuevo cuadro de dilogo
personalizado o modifica la ubicacin de men de uno existente, deber reiniciar SPSS Statistics.
Ttulo. La propiedad Ttulo especifica el texto que se mostrar en la barra de ttulo del cuadro
de dilogo.
Archivo de ayuda. La propiedad Archivo de ayuda es opcional y especifica la ruta al archivo de
ayuda del cuadro de dilogo. Se trata del archivo que se iniciar cuando el usuario pulse en
el botn Ayuda del cuadro de dilogo. Los archivos de ayuda deben estar en formato HTML.
El botn Ayuda del cuadro de dilogo de tiempo de ejecucin estar oculto si no hay ningn
archivo de ayuda asociado.
557
Creacin y gestin de cuadros de dilogo personalizados
Cualquier archivo adicional, como los archivos de imgenes y las hojas de estilo, debern
almacenarse con el archivo de ayuda principal una vez que el cuadro de dilogo personalizado se
haya instalado. Por defecto, las especificaciones de un cuadro de dilogo personalizado instalado
se almacenan en la carpeta ext/lib/<Nombre de cuadro de dilogo> del directorio de instalacin,
que se encuentra en la raz del directorio de instalacin de Windows y Linux y bajo el directorio
Contents/bin del grupo de la aplicacin de Mac. Los archivos adicionales deben encontrarse en la
raz de la carpeta, no en subcarpetas. Deben aadirse manualmente a los archivos de paquete del
cuadro de dilogo personalizado que haya creado para el cuadro de dilogo.
Si ha especificado ubicaciones alternativas para los cuadros de dilogo instalados mediante la
variable de entorno SPSS_CDIALOGS_PATH, almacene los archivos adicionales en la carpeta
<Nombre de cuadro de dilogo> de la ubicacin alternativa adecuada. Si desea obtener ms
informacin, consulte Gestin de cuadros de dilogo personalizados el p. 563.
Nota: Cuando trabaje con un cuadro de dilogo abierto desde un archivo de paquete de cuadro
de dilogo personalizado (.spd), la propiedad Archivo de ayuda sealar una carpeta temporal
asociada con el archivo .spd. Cualquier modificacin que aplique al archivo de ayuda debe
aplicarse a la copia de la carpeta temporal.
Propiedades de WebApp. Le permite asociar un archivo de propiedades con este cuadro de dilogo
para utilizarlo para generar pequeas aplicaciones cliente que se implementen en la Web.
Sin modo. Especifica si el cuadro de dilogo es modal o sin modo. Cuando un cuadro de dilogo es
modal, se deber cerrar para que el usuario pueda interactuar con las ventanas de la aplicacin
principal (Datos, Resultados y Sintaxis) o con otros cuadros de dilogo abiertos. Los cuadros de
dilogo sin modo no tienen esa restriccin. El valor por defecto es Sin modo.
Sintaxis. La propiedad Sintaxis especifica la plantilla de sintaxis que se utiliza para crear la
558
Captulo 50
para el nuevo cuadro de dilogo. Tambin puede aadir elementos al men de nivel superior
denominado Personalizado (que se encuentra entre los elementos Grficos y Utilidades), que slo
est disponible para elementos de men asociados con cuadros de dilogo personalizados.
Si desea crear mens o submens personalizados, utilice el Editor de mens. Si desea obtener
ms informacin, consulte Editor de mens en Captulo 49 el p. 548. Sin embargo, debe tener
en cuenta que los otros usuarios de su cuadro de dilogo debern crear manualmente el mismo
men o submen desde sus editores de mens, ya que de lo contrario el cuadro de dilogo se
aadir a su men Personalizado.
Nota: El cuadro de dilogo Ubicacin de men muestra todos los mens, incluidos aquellos
para mdulos adicionales. Asegrese de aadir el elemento de men en su cuadro de dilogo
personalizado para un men que estar disponible para usted o para los usuarios finales de
su cuadro de dilogo.
E Seleccione el elemento de men sobre el que desea que aparezca el nuevo cuadro de dilogo.
Una vez que se ha aadido el elemento, podr utilizar los botones Subir y Bajar para cambiar su
posicin.
559
Creacin y gestin de cuadros de dilogo personalizados
E Introduzca un ttulo para el elemento del men. Los ttulos de un men o submen dado deben
ser nicos.
E Pulse en Aadir.
Si lo desea, puede:
Aadir un separador por encima o por debajo del nuevo elemento de men.
Especificar la ruta a una imagen que aparecer junto al elemento de men del cuadro de
dilogo personalizado. Los tipos de imagen admitidos son gif y png. La imagen no debe
superar 16 x 16 pxeles.
Todos los controles que no sean listas de destino y botones de cuadros de dilogo secundarios
pueden ubicarse en la columna izquierda.
Columna central La columna central puede contener cualquier control que no sean listas de origen
ni botones de cuadros de dilogo secundarios.
Columna derecha. La columna derecha slo puede contener botones de cuadros de dilogo
secundarios.
Aunque no se muestre en el lienzo, cada cuadro de dilogo personalizado contiene los botones
Aceptar, Pegar, Cancelar y Ayuda colocados en la parte inferior del cuadro de dilogo. La presencia
y ubicaciones de estos botones es automtica, sin embargo, el botn Ayuda quedar oculto si
no hay ningn archivo de ayuda asociado al cuadro de dilogo (tal y como se especifica en la
propiedad Archivo de ayuda de Propiedades de cuadro de dilogo).
560
Captulo 50
Puede cambiar el orden vertical de los controles de una columna arrastrndolos y colocndolos
en la ubicacin que desee y podr determinar la posicin exacta de los controles. En el tiempo
de ejecucin, los controles se redimensionarn de acuerdo con el diseo del cuadro de dilogo.
Los controles como las listas de origen y de destino se expanden automticamente para llenar el
espacio disponible bajo ellas.
que desee insertar la sintaxis de comando generada por los controles, donde Identificador es
el valor de la propiedad Identificador del control. Puede seleccionar una lista de identificadores de
control disponibles pulsando Ctrl+Barra espaciadora. Si introduce manualmente identificadores,
tenga en cuenta los espacios, ya que en los identificadores son significativos.
En el tiempo de ejecucin y para todos los controles que no sean casillas de verificacin y grupos
de ellas, cada identificador se sustituye con el valor actual de la propiedad Sintaxis del control
asociado. En el caso de las casillas de verificacin y los grupos de ellas, el identificador se
sustituye por el valor actual de la propiedad Sintaxis comprobada o Sintaxis sin comprobar del
control asociado, dependiendo del estado actual del control (comprobado o sin comprobar). Si
desea obtener ms informacin, consulte Tipos de controles el p. 565.
561
Creacin y gestin de cuadros de dilogo personalizados
Considere una versin simplificada del cuadro de dilogo Frecuencias que slo contiene un
control de lista de origen y un control de lista de destino, y que genera una sintaxis de comando
de la siguiente forma:
FREQUENCIES VARIABLES=var1 var2...
/FORMAT = NOTABLE
/BARCHART.
En el tiempo de ejecucin se sustituirn por el valor actual de la propiedad Sintaxis del control.
562
Captulo 50
elementos.
La siguiente tabla muestra una forma de especificar las propiedades Sintaxis del grupo de
elementos y las casillas de verificacin que contiene para poder generar el resultado deseado.
La propiedad Sintaxis de la lista de destino debe definirse como %%EsteValor%%, tal y como
se describe en el ejemplo anterior.
Propiedad Sintaxis del grupo de elementos
/STATISTICS %%ThisValue%%
MEAN
STDDEV
MINIMUM
MAXIMUM
563
Creacin y gestin de cuadros de dilogo personalizados
Las listas de variables de origen se cumplimentan con variables auxiliares o dummy; que
pueden trasladarse a las listas de destino.
Puede instalar el cuadro de dilogo que est actualmente abierto en el generador de cuadros
de dilogo personalizados o instalarlo desde un archivo de paquete de cuadros de dilogo
personalizados (.spd). Si vuelve a instalar un cuadro de dilogo existente se reemplazar la
versin actual.
Para instalar el cuadro de dilogo que tenga abierto actualmente:
E En los mens del generador de cuadros de dilogo personalizados, elija:
Archivo
Instalar
564
Captulo 50
Para utilizar un nuevo cuadro de dilogo personalizado, deber reiniciar SPSS Statistics. La
reinstalacin de un cuadro de dilogo existente no requiere reiniciar a no ser que cambie la
ubicacin de men.
Por defecto, la instalacin de un cuadro de dilogo requiere un permiso de escritura sobre el
directorio de instalacin de SPSS Statistics. Si no tiene permisos de escritura sobre ese directorio
o desea almacenar los cuadros de dilogo instalados en otro lugar, puede especificar una o ms
ubicaciones alternativas definiendo la variable de entorno SPSS_CDIALOGS_PATH. Si hay rutas
especificadas en SPSS_CDIALOGS_PATH, stas tienen prioridad sobre el directorio de instalacin
de SPSS Statistics. Si hay mltiples ubicaciones, separe cada una de ellas con un punto y coma en
Windows y con dos puntos en Linux y Mac.
Apertura de un cuadro de dilogo instalado
Puede abrir un cuadro de dilogo personalizado que ya haya instalado, lo que le permite
modificarlo y/o guardarlo externamente para poder distribuirlo a otros usuarios.
E En los mens del generador de cuadros de dilogo personalizados, elija:
Archivo
Abrir instalado
Nota: Si est abriendo un cuadro de dilogo instalado para modificarlo, al seleccionar Archivo >
Instalar volver a instalarlo, sustituyendo as la versin existente.
Desinstalacin de un cuadro de dilogo personalizado
E En los mens del generador de cuadros de dilogo personalizados, elija:
Archivo
Desinstalar
Puede abrir un archivo de paquete de cuadros de dilogo personalizados que contenga las
especificaciones de un cuadro de dilogo personalizado, lo que le permitir modificar el cuadro
de dilogo y volver a guardarlo o instalarlo.
E En los mens del generador de cuadros de dilogo personalizados, elija:
Archivo
Abrir
565
Creacin y gestin de cuadros de dilogo personalizados
Tipos de controles
La paleta de herramientas ofrece los controles que pueden aadirse a un cuadro de dilogo
personalizado.
Lista de origen: Una lista de variables de origen del conjunto de datos activo. Si desea obtener
Lista de destino: Destino para las variables transferidas desde la lista de origen. Si desea
Control de texto: Cuadro de texto que acepta la introduccin de cualquier texto. Si desea
Control de nmero: Cuadro de texto que slo admite la introduccin de valores numricos. Si
Control de texto esttico: Control para mostrar texto esttico. Si desea obtener ms
seleccin el p. 572.
Grupo de casillas de verificacin: Contenedor par aun conjunto de controles que se activan
o desactivan como grupo, mediante una nica casilla de verificacin. Si desea obtener ms
informacin, consulte Grupo de casillas de verificacin el p. 573.
566
Captulo 50
Explorador de archivos: Control para examinar el sistema de archivos con el fin de abrir o
Botn de sub-cuadro de dilogo: Botn que permite iniciar un sub-cuadro de dilogo. Si desea
Lista de origen
El control Lista de variables de origen muestra la lista de variables del conjunto de datos activo
que estn disponibles para el usuario final del cuadro de dilogo. Puede mostrar todas las variables
del conjunto de datos activo (el conjunto por defecto) o bien filtrar la lista en funcin del nivel de
medicin y tipo, por ejemplo, variables numricas que tengan un nivel de medicin de escala. El
uso de un control de lista de origen implica el uso de uno o ms controles de Lista de destino. El
control Lista de origen tiene las siguientes propiedades:
Identificador. Identificador nico del control.
Ttulo. Ttulo opcional que aparece por encima del control. Si el ttulo tiene mltiples lneas,
utilice \n para indicar los saltos de lnea.
Sugerencia. Texto de sugerencia opcional que aparece cuando el usuario pasa por encima del
control. El texto especificado slo aparece al pasar el ratn sobre el rea de ttulo del control.
Si pasa el ratn sobre una de las variables enumeradas se mostrar el nombre y la etiqueta
de la variable.
Tecla mnemnica. Carcter opcional del ttulo que se debe usar como mtodo abreviado de teclado
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Transferencias de variables. Especifica si las variables transferidas desde la lista de origen a la
Lista de destino
El control Lista de destino ofrece un destino para las variables que se transfieren desde la lista
de origen. Si se utiliza el control Lista de destino se asume que hay un control Lista de origen
presente. Puede especificar que slo se transfiera al control una nica variable o que se transfieran
mltiples variables, as como restringir qu tipos de variables se transfieren, por ejemplo, slo
567
Creacin y gestin de cuadros de dilogo personalizados
variables numricas con un nivel de medicin nominal u ordinal. El control Lista de destino tiene
las siguientes propiedades:
Identificador. Identificador nico del control. ste es el identificador que hay que utilizar cuando
se hace referencia al control de la plantilla de sintaxis.
Ttulo. Ttulo opcional que aparece por encima del control. Si el ttulo tiene mltiples lneas,
utilice \n para indicar los saltos de lnea.
Sugerencia. Texto de sugerencia opcional que aparece cuando el usuario pasa por encima del
control. El texto especificado slo aparece al pasar el ratn sobre el rea de ttulo del control.
Si pasa el ratn sobre una de las variables enumeradas se mostrar el nombre y la etiqueta
de la variable.
Tipo de lista de destino. Especifica si es posible transferir al control mltiples variables o slo una
nica variable.
Tecla mnemnica. Carcter opcional del ttulo que se debe usar como mtodo abreviado de teclado
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Necesaria para la ejecucin. Especifica si un valor es obligatorio en este control para que tenga
lugar la ejecucin. Si especifica Verdadero, los botones Aceptar y Pegar se desactivarn hasta que
no se especifique un valor para este control. Si especifica Falso, la ausencia de un valor en este
control no afectar al estado de los botones Aceptar y Pegar. El valor por defecto es Verdadero.
Filtro de variables. Le permite restringir los tipos de variables que pueden transferirse al control.
Puede restringir por tipo de variable y por nivel de medicin, as como especificar si es posible
transferir mltiples conjuntos de respuestas al control. Pulse en el botn de puntos suspensivos
(...) para abrir el cuadro de dilogo Filtro. Si desea obtener ms informacin, consulte Filtrado de
listas de variables el p. 568.
Sintaxis. Especifica la sintaxis de comandos generada por este control en el tiempo de ejecucin y
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
568
Captulo 50
El cuadro de dilogo Filtro, que se asocia con listas de variables de origen y de destino, le
permite filtrar los tipos de variables del conjunto de datos activo que pueden aparecer en las
listas. Tambin puede especificar si se incluyen mltiples conjuntos de respuestas asociados con
el conjunto de datos activo. Las variables numricas incluyen todos los formatos numricos
menos los de fecha y hora.
Casilla de verificacin
El control Casilla de verificacin es una sencilla casilla de verificacin que puede generar una
sintaxis de comando distinta para el estado comprobada y para el estado sin comprobar. El control
Casilla de verificacin tiene las siguientes propiedades:
Identificador. Identificador nico del control. ste es el identificador que hay que utilizar cuando
control.
Tecla mnemnica. Carcter opcional del ttulo que se debe usar como mtodo abreviado de teclado
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Valor predeterminado. Estado por defecto de la casilla de verificacin: seleccionada o sin
seleccionar.
Sintaxis comprobada/sin comprobar. Especifica la sintaxis de comandos que se genera cuando el
control est comprobado y cuando est sin comprobar. Para incluir la sintaxis de comandos en la
plantilla de sintaxis, utilice el valor de la propiedad Identificador. La sintaxis generada, ya sea a
569
Creacin y gestin de cuadros de dilogo personalizados
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
Cuadro combinado
El control Cuadro combinado le permite crear una lista desplegable que genere una sintaxis de
comandos especfica del elemento de lista seleccionado. El control Cuadro combinado tiene
las siguientes propiedades:
Identificador. Identificador nico del control. ste es el identificador que hay que utilizar cuando
control.
Elementos de lista. Pulse en el botn de puntos suspensivos (...) para abrir el cuadro de dilogo
Listar propiedades de elementos, que le permite especificar los elementos de lista del control
de cuadro combinado.
Tecla mnemnica. Carcter opcional del ttulo que se debe usar como mtodo abreviado de teclado
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Sintaxis. Especifica la sintaxis de comandos generada por este control en el tiempo de ejecucin y
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
un campo obligatorio.
Predeterminado. Especifica si el elemento de la lista es el elemento por defecto que se muestra en
el cuadro combinado.
570
Captulo 50
de la lista.
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
Puede aadir un nuevo elemento de lista en la lnea en blanco que aparece al final de la lista
existente. Si introduce propiedades diferentes del identificador se generar un identificador nico
que puede conservar o modificar. Puede eliminar un elemento de lista pulsando en la casilla
Identificador del elemento y pulsando eliminar.
Control de texto
Un control de texto es un sencillo cuadro de texto que puede admitir la introduccin de cualquier
valor y que tiene las siguientes propiedades:
Identificador. Identificador nico del control. ste es el identificador que hay que utilizar cuando
se hace referencia al control de la plantilla de sintaxis.
Ttulo. Ttulo opcional que aparece por encima del control. Si el ttulo tiene mltiples lneas,
utilice \n para indicar los saltos de lnea.
Sugerencia. Texto de sugerencia opcional que aparece cuando el usuario pasa por encima del
control.
Tecla mnemnica. Carcter opcional del ttulo que se debe usar como mtodo abreviado de teclado
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Contenido de texto. Especifica si el contenido es arbitrario o si el cuadro de texto debe contener
una cadena que respete las reglas de los SPSS Statistics nombres de variables.
Valor predeterminado. Contenido por defecto del cuadro de texto.
Necesaria para la ejecucin. Especifica si un valor es obligatorio en este control para que tenga
lugar la ejecucin. Si especifica Verdadero, los botones Aceptar y Pegar se desactivarn hasta que
no se especifique un valor para este control. Si especifica Falso, la ausencia de un valor en este
control no afectar al estado de los botones Aceptar y Pegar. El valor por defecto es Falso.
Sintaxis. Especifica la sintaxis de comandos generada por este control en el tiempo de ejecucin y
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
Control de nmero
El control Nmero es un cuadro de texto para introducir un valor numrico y tiene las siguientes
propiedades:
Identificador. Identificador nico del control. ste es el identificador que hay que utilizar cuando
se hace referencia al control de la plantilla de sintaxis.
571
Creacin y gestin de cuadros de dilogo personalizados
Ttulo. Ttulo opcional que aparece por encima del control. Si el ttulo tiene mltiples lneas,
utilice \n para indicar los saltos de lnea.
Sugerencia. Texto de sugerencia opcional que aparece cuando el usuario pasa por encima del
control.
Tecla mnemnica. Carcter opcional del ttulo que se debe usar como mtodo abreviado de teclado
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Tipo numrico. Especifica las limitaciones sobre lo que puede introducirse. Un valor de Real
especifica que no hay ninguna restriccin al valor introducido, aparte de que sea numrico. El
valor Entero especifica que el valor debe ser un nmero entero.
Valor predeterminado. El valor por defecto, si lo hay.
Valor mnimo. El valor mnimo permitido, si lo hay.
Valor mximo. El valor mximo permitido, si lo hay.
Necesaria para la ejecucin. Especifica si un valor es obligatorio en este control para que tenga
lugar la ejecucin. Si especifica Verdadero, los botones Aceptar y Pegar se desactivarn hasta que
no se especifique un valor para este control. Si especifica Falso, la ausencia de un valor en este
control no afectar al estado de los botones Aceptar y Pegar. El valor por defecto es Falso.
Sintaxis. Especifica la sintaxis de comandos generada por este control en el tiempo de ejecucin y
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
Grupo de elementos
El control Grupo de elementos es un contenedor de otros controles, lo que le permite agrupar
y controlar la sintaxis generada desde mltiples controles. Por ejemplo, tiene un conjunto de
casillas de verificacin que especifican ajustes opcionales para un subcomando, pero slo
desea generar la sintaxis del subcomando si hay al menos una casilla seleccionada. Esto se
consigue utilizando un control Grupo de elementos como contenedor de los controles de casilla
de verificacin. Los siguientes tipos de controles pueden incluirse en un Grupo de elementos:
casilla de verificacin, cuadro combinado, control de texto, control de nmero, texto esttico,
572
Captulo 50
saltos de lnea.
Necesaria para la ejecucin. Verdadero especifica que los botones Aceptar y Pegar se desactivarn
hasta que un control del grupo genere una sintaxis de comandos. Si se especifica Falso, la ausencia
de sintaxis de tiempo de ejecucin de este control no afectar al estado de los botones Aceptar y
Pegar. El valor por defecto es Falso.
Por ejemplo, el grupo se compone de un conjunto de casillas de verificacin, cada una de las
cuales slo genera sintaxis cuando est seleccionada. Si Necesaria para la ejecucin se define
como Verdadero y todas las casillas estn sin seleccionar, Aceptar y Pegar estarn desactivadas.
Sintaxis. Especifica la sintaxis de comandos generada por este control en el tiempo de ejecucin y
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
El valor %%EsteValor%% genera una lista separada por espacios en blanco de la sintaxis
generada por cada control del grupo de elementos en el mismo orden en que aparecen en el
grupo (de arriba a abajo). Este es el mtodo por defecto. Si se especifica %%EsteValor%%
y ninguno de los controles del grupo de elementos genera ninguna sintaxis, el grupo de
elementos en conjunto no generar ninguna sintaxis de comandos.
Grupo de seleccin
El control Grupo de seleccin es un contenedor de un conjunto de botones de seleccin y tiene
las siguientes propiedades:
Identificador. Identificador nico del control. ste es el identificador que hay que utilizar cuando
control.
Botones de seleccin. Pulse en el botn de puntos suspensivos (...) para abrir el cuadro dilogo
Propiedades del grupo de botones de seleccin, que le permite especificar las propiedades de los
botones de seleccin, as como aadir o eliminar botones del grupo.
Sintaxis. Especifica la sintaxis de comandos generada por este control en el tiempo de ejecucin y
573
Creacin y gestin de cuadros de dilogo personalizados
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
control.
Tecla mnemnica. Carcter opcional del nombre que se debe usar con fines nemotcnicos. El
seleccin.
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
Puede aadir un nuevo botn de seleccin en la lnea en blanco que aparece al final de la lista
existente. Si introduce propiedades diferentes del identificador se generar un identificador nico
que puede conservar o modificar. Puede eliminar un botn de seleccin pulsando en la casilla
Identificador del botn y pulsando eliminar.
control.
574
Captulo 50
Tecla mnemnica. Carcter opcional del ttulo que se debe usar como mtodo abreviado de teclado
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Valor predeterminado. Estado por defecto de la casilla de verificacin de control: seleccionada o
sin seleccionar.
Sintaxis comprobada/sin comprobar. Especifica la sintaxis de comandos que se genera cuando el
control est comprobado y cuando est sin comprobar. Para incluir la sintaxis de comandos en la
plantilla de sintaxis, utilice el valor de la propiedad Identificador. La sintaxis generada, ya sea a
partir de la propiedad Sintaxis comprobada o Sintaxis sin comprobar, se insertar en la posicin
especificada del identificador. Por ejemplo, si el identificador es grupocasillasverificacin1, en el
tiempo de ejecucin todas las instancias de %%grupocasillasverificacin1%% de la plantilla
de sintaxis se sustituirn por el valor de la propiedad Sintaxis comprobada cuando se seleccione el
cuadro y por el de la propiedad Sintaxis sin comprobar cuando el cuadro no est seleccionado.
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
Explorador de archivos
El control Explorador de archivos se compone de un cuadro de texto con una ruta de archivo y
botn de examinar que abre un cuadro de dilogo estndar de SPSS Statistics en el que abrir o
guardar un archivo. El control Explorador de archivos tiene las siguientes propiedades:
Identificador. Identificador nico del control. ste es el identificador que hay que utilizar cuando
se hace referencia al control de la plantilla de sintaxis.
Ttulo. Ttulo opcional que aparece por encima del control. Si el ttulo tiene mltiples lneas,
utilice \n para indicar los saltos de lnea.
Sugerencia. Texto de sugerencia opcional que aparece cuando el usuario pasa por encima del
control.
Tecla mnemnica. Carcter opcional del ttulo que se debe usar como mtodo abreviado de teclado
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Funcionamiento del sistema de archivos. Especifica si el cuadro de dilogo iniciado con el botn de
examinar es adecuado para abrir o guardar archivos. Un valor de Abrir indica que el cuadro de
dilogo de explorador valida la existencia del archivo especificado. Un valor de Guardar indica
que el cuadro de dilogo de explorador no valida la existencia del archivo especificado.
575
Creacin y gestin de cuadros de dilogo personalizados
Tipo de explorador. Especifica si el cuadro de dilogo del explorador se utiliza para seleccionar un
examina el sistema de archivos en el que se est ejecutando SPSS Statistics Server o bien el
sistema de archivos de su equipo local: para ello, seleccione Servidor para examinar el sistema
de archivos del servidor y Cliente para examinar el sistema de archivos del equipo local. La
propiedad no tiene ningn efecto en el modo de anlisis local.
Necesaria para la ejecucin. Especifica si un valor es obligatorio en este control para que tenga
lugar la ejecucin. Si especifica Verdadero, los botones Aceptar y Pegar se desactivarn hasta que
no se especifique un valor para este control. Si especifica Falso, la ausencia de un valor en este
control no afectar al estado de los botones Aceptar y Pegar. El valor por defecto es Falso.
Sintaxis. Especifica la sintaxis de comandos generada por este control en el tiempo de ejecucin y
Puede especificar cualquier sintaxis de comandos vlida y utilizar \n para los saltos de lnea.
El valor %%EsteValor%% especifica el valor de tiempo de ejecucin del cuadro de texto, que
es la ruta de archivo, especificada manualmente o rellenada mediante el cuadro de dilogo del
explorador. Este es el mtodo por defecto.
El cuadro de dilogo Filtro de archivos le permite especificar los tipos de archivos que se muestran
en las listas desplegables Archivos del tipo y Guardar como tipo, a los que se accede desde un
control Explorador del sistema de archivos. Por defecto se admiten todos los tipos de archivo.
Para especificar tipos de archivo que no se enumeren explcitamente en el cuadro de dilogo:
E Seleccione Otro.
576
Captulo 50
E Introduzca un nombre para el tipo de archivo.
E Introduzca un tipo de archivo con el formato *.sufijo, por ejemplo, *.xls. Puede especificar
control.
Sub-cuadro de dilogo. Pulse en el botn de puntos suspensivos (...) para abrir el Generador
para el control. El carcter aparece subrayado en el ttulo. El mtodo abreviado se activa pulsando
Alt+[tecla mnemnica]. La propiedad Tecla mnemnica no es compatible con Mac.
Nota: El control Botn de sub-cuadro de dilogo no puede aadirse a un sub-cuadro de dilogo.
cuadro de dilogo principal o pulse una vez en el botn del sub-cuadro de dilogo y pulse en el
botn de puntos suspensivos (...) para la propiedad de sub-cuadro de dilogo.
E En el sub-cuadro de dilogo, pulse en el lienzo de una zona fuera de los controles. Si no hay
ningn control en el lienzo, las propiedades del sub-cuadro de dilogo siempre estarn visibles.
Nombre de sub-cuadro de dilogo. Identificador nico de sub-cuadro de dilogo. La propiedad
577
Creacin y gestin de cuadros de dilogo personalizados
Archivo de ayuda. Especifica la ruta a un archivo de ayuda opcional del sub-cuadro de dilogo. Es
el archivo que se iniciar cuando el usuario pulse en el botn Ayuda del sub-cuadro de dilogo,
y puede ser el mismo archivo de ayuda especificado para el cuadro de dilogo principal. Los
archivos de ayuda deben estar en formato HTML. Consulte la descripcin de la propiedad Archivo
de ayuda de Propiedades de cuadro de dilogo si desea ms informacin.
Sintaxis. Pulse en el botn de puntos suspensivos (...) para abrir la plantilla de sintaxis. Si desea
Puede crear un cuadro de dilogo personalizado para un comando de extensin que haya escrito
tanto usted como cualquier otro usuario. La plantilla de sintaxis del cuadro de dilogo debe
generar la sintaxis de comando del comando de extensin. Si el cuadro de dilogo personalizado es
para su uso exclusivo, instlelo. Suponiendo que el comando de extensin ya est implementado
en el sistema, podr ejecutar el comando desde el cuadro de dilogo instalado.
Si est creando un cuadro de dilogo personalizado para un comando de extensin y desea
compartirlo con otros usuarios, deber guardar las especificaciones del cuadro de dilogo en
un archivo de paquete de cuadros de dilogo personalizados (.spd) y distribuir ese archivo. El
archivo del paquete de cuadros de dilogo personalizados no contendr las especificaciones del
propio comando de extensin, sino slo las especificaciones del cuadro de dilogo personalizado.
Adems, deber suministrar a los usuarios finales el archivo XML que especifica la sintaxis del
comando de extensin y el cdigo de implementacin escrito en Python o R.
Instalacin de comandos de extensin con cuadros de dilogo personalizados asociados
de dilogo personalizados con el elemento Instalar cuadro de dilogo personalizado del men
Utilidades.
578
Captulo 50
propiedades contendr todas las cadenas localizables asociadas al cuadro de dilogo. Por defecto,
se almacenan en la carpeta ext/lib/<Nombre del cuadro de dilogo> del directorio de instalacin
de SPSS Statistics, que se encuentra en la raz del directorio de instalacin de Windows y Linux y
bajo el directorio Contents/bin del grupo de la aplicacin SPSS Statistics 17.0 en Mac. La copia
debe encontrarse en la misma carpeta, y no en una subcarpeta.
579
Creacin y gestin de cuadros de dilogo personalizados
de notas de Windows o la aplicacin TextEdit de Mac. Modifique los valores asociados con
cualquier propiedad que deba localizar, pero no modifique los nombres de las propiedades. Las
propiedades asociadas con un control especfico reciben el prefijo del identificador del control.
Por ejemplo, la propiedad Sugerencia de un control con el identificador botn_opciones es
botn_opciones_Sugerencia_LABEL. Las propiedades de Ttulo se denominan simplemente
<identificador>_LABEL , como en botn_opciones_LABEL. Los dos puntos empleados en los
valores de propiedad deben incluir una barra diagonal inversa, como en \:.
Cuando se inicie el cuadro de dilogo, SPSS Statistics buscar el archivo de propiedades cuyo
identificador de idioma coincida con el idioma actual, tal y como se especifica en la lista
desplegable Idioma de la pestaa General del cuadro de dilogo Opciones. Si no se encuentra
el archivo de propiedades, se utilizar el archivo predeterminado <Nombre del cuadro de
dilogo>.properties
Para localizar el archivo de ayuda
E Realice una copia del archivo de ayuda asociado con el cuadro de dilogo y localice el texto en
el idioma deseado. La copia debe encontrarse en la misma carpeta que el archivo de ayuda, y
no es una subcarpeta. El archivo de ayuda debe encontrarse en la carpeta ext/lib/<Nombre del
cuadro de dilogo> del directorio de instalacin de SPSS Statistics, que se encuentra en la raz
del directorio de instalacin de Windows y Linux y bajo el directorio Contents/bin del grupo de
la aplicacin SPSS Statistics 17.0 en Mac.
Si ha especificado ubicaciones alternativas para los cuadros de dilogo instalados mediante la
variable de entorno SPSS_CDIALOGS_PATH, la copia debe ubicarse en la carpeta <Nombre del
cuadro de dilogo> de la ubicacin alternativa adecuada. Si desea obtener ms informacin,
consulte Gestin de cuadros de dilogo personalizados el p. 563.
E Cambie el nombre de la copia a <Archivo de ayuda>_<identificador de idioma> utilizando los
580
Captulo 50
Cuando se inicie el cuadro de dilogo, SPSS Statistics buscar el archivo de ayuda cuyo
identificador de idioma coincida con el idioma actual, tal y como se especifica en la lista
desplegable Idioma de la pestaa General del cuadro de dilogo Opciones. Si no se encuentra
ese archivo de ayuda, se utilizar el archivo de ayuda especificado para el cuadro de dilogo (el
archivo especificado en la propiedad Archivo de ayuda de Propiedades de cuadro de dilogo).
Identificadores de idioma
de
en
Alemn
Ingls
es
Espaol
fr
Francs
it
Italiano
ja
Japons
ko
Coreano
pl
ru
Ruso
zh_cn
Chino simplificado
zh_tw
Chino tradicional
Polaco
Nota: El texto de los cuadros de dilogo personalizados y los archivos de ayuda asociados no
se limitan a los idiomas admitidos por SPSS Statistics. Puede escribir el cuadro de dilogo y el
texto de ayuda en cualquier idioma sin crear archivos de ayuda y de propiedades especficos de
ese idioma. Todos los usuarios de su cuadro de dilogo vern el texto en ese idioma.
Captulo
Trabajos de produccin
51
581
582
Captulo 51
Figura 51-1
Cuadro de dilogo Trabajo de produccin
E Pulse en Nuevo para crear un nuevo trabajo de produccin o en Abrir para abrir un trabajo de
produccin existente.
Nota: los archivos de trabajo de la unidad de produccin (.spp) creados con versiones anteriores a
la 16.0 no funcionarn en la versin 16.0 o versiones posteriores. Hay disponible una utilidad
de conversin para convertir los archivos de trabajo de la unidad de produccin de Windows y
Macintosh a trabajos de produccin (.spj). Si desea obtener ms informacin, consulte Conversin
de los archivos de la unidad de produccin el p. 589.
E Seleccione uno o ms archivos de sintaxis de comandos.
Nota: en el anlisis en modo distribuido, las ubicaciones de los archivos de sintaxis deben
introducirse manualmente y las rutas deben ser relativas al servidor remoto. Si desea obtener ms
informacin, consulte Especificaciones de rutas absolutas frente a rutas relativas en Captulo
4 el p. 74.
E Seleccione el nombre del archivo de resultados, su ubicacin y formato.
E Pulse en Guardar o en Guardar como para guardar el trabajo de produccin.
Formato de sintaxis. Controla la forma de las reglas de sintaxis utilizadas para el trabajo.
Interactivo. Cada comando debe finalizar con un punto. Los puntos pueden aparecer en
cualquier parte del comando y los comandos pueden continuar en varias lneas, aunque un
punto como ltimo carcter no en blanco en una lnea se interpreta como el final del comando.
Las lneas de continuacin y los comandos nuevos pueden empezar en cualquier parte de
583
Trabajos de produccin
una lnea nueva. Se trata de reglas interactivas que surten efecto al seleccionar y ejecutar
comandos en una ventana de sintaxis.
Lote. Cada comando debe comenzar al principio de una lnea nueva (sin espacios en blanco
antes del inicio del comando) y las lneas de continuacin se deben sangrar como mnimo un
espacio. Si desea sangrar comandos nuevos, puede utilizar un signo ms o un punto como
primer carcter al inicio de la lnea y, a continuacin, sangrar el comando. El punto del
final del comando es opcional. Este ajuste es compatible con las reglas de sintaxis para los
archivos de comandos incluidos con el comando INCLUDE.
Nota: no utilice la opcin Lote si sus archivos de sintaxis contienen la sintaxis de comandos
de GGRAPH que incluya instrucciones GPL. Las instrucciones GPL slo se ejecutarn segn
reglas interactivas.
Procesamiento de errores. Controla el tratamiento de errores en el trabajo.
Continuar procesando despus de los errores. Los errores del trabajo no detienen
Archivo del Visor al disco (.spv). Los resultados se guardan en el formato del Visor de SPSS
Archivo del Visor (.spv) a PES Repository. Es necesaria la opcin Adaptor para Enterprise
Services.
Informes Web (.spv) a PES Repository. Es necesaria la opcin Adaptor para Enterprise Services.
Word/RTF (*.doc). Las tablas pivote se exportan como tablas de Word, con todos los atributos
de formato intactos (por ejemplo, bordes de casilla, estilos de fuente y colores de fondo). Los
resultados de texto se exportan en formato RTF. Los grficos, diagramas de rbol y vistas de
modelo se incluyen en formato PNG.
Nota: es posible que Microsoft Word no muestre correctamente las tablas muy anchas.
Excel (*.xls). Las filas, columnas y casillas de tablas pivote se exportan como filas, columnas y
casillas de Excel, con todos los atributos de formato intactos, por ejemplo, bordes de casilla,
estilos de fuente y colores de fondo, etc. Los resultados de texto se exportan con todos los
atributos de fuente intactos. Cada lnea del resultado de texto constituye una fila del archivo
de Excel y se incluye todo su contenido en una sola casilla. Los grficos, diagramas de rbol y
vistas de modelo se incluyen en formato PNG.
HTML (*.htm). Las tablas pivote se exportan como tablas HTML. Los resultados de texto se
exportan como formato previo de HTML. Los grficos, diagramas de rbol y vistas de modelo
se incrustan mediante referencias y deben exportarse en un formato adecuado para incluirlos
en los documentos HTML (por ejemplo, PNG y JPEG).
584
Captulo 51
Formato de documento porttil (*.pdf). Todos los resultados es exportan como aparecen en la
Archivo PowerPoint (*.ppt). Las tablas pivote se exportan como tablas de Word y se incrustan
Texto (*.txt). Entre los formatos de resultados de texto se incluyen texto sin formato, UTF-8,
and UTF-16. Las tablas pivote se pueden exportar en formato separado por tabuladores o por
espacios. Todos los resultados de texto se exportan en formato separado por espacios. En los
grficos, diagramas de rbol y vistas de modelo, se inserta una lnea en el archivo de texto
para cada grfico, indicando el nombre de archivo de la imagen.
Imprimir archivo del Visor al finalizar. Enva el archivo de resultados finales del Visor a la impresora
Los trabajos de produccin tienen en cuenta comandos OUTPUT, como OUTPUT SAVE, OUTPUT
ACTIVATE y OUTPUT NEW. Los comandos OUTPUT SAVE, que se ejecutan durante un trabajo
de produccin, escribirn el contenido de los documentos de resultados especificados en las
ubicaciones especificadas. Esto se aade al archivo de resultados creado por el trabajo de
produccin. Al utilizar OUTPUT NEW para crear un nuevo documento de resultados, se recomienda
que lo guarde expresamente con el comando OUTPUT SAVE.
El archivo de resultados del trabajo de produccin est compuesto por el contenido del
documento de resultados activo durante la finalizacin del trabajo. Para aquellos trabajos que
contengan comandos OUTPUT, el archivo de resultados no puede contener todos los resultados
creados en la sesin. Por ejemplo, supongamos que el trabajo de produccin est compuesto por
un nmero de procedimientos de SPSS seguidos de un nuevo comando OUTPUT NEW, seguidos de
ms procedimientos de SPSS, pero no de ningn comando OUTPUT. El comando OUTPUT NEW
define un nuevo documento de salida activo. Al finalizar el trabajo de produccin, contendr
nicamente los resultados de los procedimientos que se hayan ejecutado despus del comando
OUTPUT NEW.
Opciones de HTML
Opciones de tabla. No hay disponibles opciones de tabla para el formato HTML. Las tablas
sistemas operativos Windows, tambin est disponible el formato EMF (metarchivo mejorado).
Tambin puede ajustar la escala del tamao de imagen del 1% al 200%.
585
Trabajos de produccin
Opciones de PowerPoint
Opciones de tabla. Puede utilizar las entradas de titulares del Visor como los ttulos de las
diapositivas. Cada diapositiva contiene un nico elemento de resultado. El ttulo se genera a partir
de la entrada del titular para el elemento en el panel de titulares del Visor.
Opciones de imagen. Puede ajustar la escala del tamao de imagen del 1% al 200%. (Las imgenes
se exportan a PowerPoint en formato TIFF.)
Nota: el formato PowerPoint slo est disponible en sistemas operativos Windows y necesita
PowerPoint 97 o una versin posterior.
Opciones de PDF
Incrustar marcadores. Esta opcin incluye en el documento PDF los marcadores correspondientes
a las entradas de titulares del Visor. Al igual que el panel de titulares del Visor, los marcadores
pueden facilitar mucho la navegacin por los documentos que tienen un gran nmero de objetos
de resultados.
Incrustar fuentes. Al incrustar fuentes se garantiza que el documento PDF presentar el mismo
Opciones de texto
Opciones de tabla. Las tablas pivote se pueden exportar en formato separado por tabuladores o por
Ancho de columna. Autoajuste no muestra nunca el contenido de las columnas en varias lneas.
Cada columna tiene el ancho correspondiente al valor o etiqueta ms ancho que haya en
dicha columna. Personalizado establece un ancho de columna mximo que se aplica a todas
las columnas de la tabla. Los valores que superen dicho ancho se mostrarn en otra lnea en
la misma columna.
Carcter de borde de fila/columna. Controla los caracteres utilizados para crear los bordes de
fila y de columna. Para suprimir la visualizacin de los bordes de fila y columna, especifique
espacios en blanco para estos valores.
Opciones de imagen. Los tipos de imagen disponibles son: EPS, JPEG, TIFF, PNG y BMP. En los
sistemas operativos Windows, tambin est disponible el formato EMF (metarchivo mejorado).
Tambin puede ajustar la escala del tamao de imagen del 1% al 200%.
586
Captulo 51
solicite el nombre de un archivo de datos cada vez que se ejecute un trabajo de produccin que
utilice la cadena @datafile en vez de un nombre de archivo en el archivo de sintaxis de comandos.
Figura 51-2
Cuadro de dilogo Trabajo de produccin, pestaa Valores de tiempo de ejecucin
Smbolo. La cadena del archivo de sintaxis de comandos que desencadena que el trabajo de
produccin solicite el valor al usuario. El nombre del smbolo debe comenzar con un signo @
y debe cumplir las normas de denominacin de variables. Si desea obtener ms informacin,
consulte Nombres de variable en Captulo 5 el p. 79.
Valor por defecto. Valor que utiliza por defecto el trabajo de produccin si no se introduce un valor
nuevo. Este valor se muestra cuando el trabajo de produccin solicita informacin al usuario.
Puede sustituir o modificar el valor en el momento de la ejecucin. Si no introduce un valor por
defecto, no utilice la palabra clave silent al ejecutar el trabajo de produccin con modificadores
de la lnea de comandos, a no ser que tambin utilice el modificador -symbol para especificar los
valores de tiempo de ejecucin. Si desea obtener ms informacin, consulte Ejecucin de trabajos
de produccin desde una lnea de comandos el p. 588.
Entrada del usuario. Etiqueta descriptiva que se muestra cuando el trabajo de produccin solicita al
usuario que introduzca informacin. Por ejemplo, podra utilizar la frase Qu archivo de datos
desea utilizar? para identificar un campo que requiera el nombre de un archivo de datos.
Valor entre comillas. Encierra entre comillas el valor por defecto o el valor introducido por el
587
Trabajos de produccin
Figura 51-3
Smbolos de tiempo de ejecucin en un archivo de sintaxis de comandos
588
Captulo 51
En funcin de cmo se haya invocado el trabajo de produccin, es posible que sea necesario
incluir rutas de acceso de los directorios para el archivo ejecutable statistics (ubicado en el
directorio donde se ha instalado la aplicacin) y/o el archivo del trabajo de produccin.
Puede ejecutar trabajos de produccin desde una lnea de comandos con los siguientes
modificadores:
-production [prompt|silent]. Inicia la aplicacin en modo de produccin. Las palabras clave prompt
y silent especifican si se desea mostrar el cuadro de dilogo que solicita los valores en tiempo de
ejecucin, en caso de que se hayan especificado en el trabajo. La palabra clave prompt es el valor
por defecto y muestra el cuadro de dilogo. La palabra clave silent suprime dicho cuadro de
dilogo. Si utiliza la palabra clave silent, puede definir los smbolos de tiempo de ejecucin con
el modificador -symbol. En caso contrario, se utilizar el valor por defecto. Los conmutadores
-switchserver y -singleseat se ignoran si utiliza el conmutador -production.
-symbol <valores>. Lista de parejas smbolo-valor utilizadas en el trabajo de produccin. Cada
nombre de smbolo comienza por @. Los valores que contienen espacios deben escribirse entre
comillas. Las reglas que permiten incluir comillas o apstrofos en los literales de cadena pueden
cambiar de un sistema operativo a otro, pero por lo general es posible escribir una cadena que
contenga comillas simples o apstrofos entre comillas dobles (por ejemplo, 'un valor entre
comillas').
Para ejecutar trabajos de produccin en un servidor remoto en un anlisis en modo distribuido, se
debe introducir la informacin de acceso al servidor:
-server <inet:nombrehost:puerto>. Nombre o direccin IP y nmero de puerto del servidor. Slo
Windows.
-user <nombre>. Nombre vlido de usuario. Si es necesario un nombre de dominio, escriba antes
del nombre del usuario el nombre del dominio y una barra invertida (\). Slo Windows.
-password <contrasea>. Contrasea del usuario. Slo Windows.
Ejemplo
statistics \production_jobs\prodjob1.spj -production silent -symbol @datafile /data/July_data.sav
Este ejemplo supone que est ejecutando la lnea de comandos desde el directorio de
instalacin, as que no es necesaria una ruta para el archivo ejecutable statistics.
Este ejemplo tambin supone que el trabajo de produccin especifica que el valor de @datafile
debe estar entre comillas (casilla de verificacin Valor entre comillas de la pestaa Valores
de tiempo de ejecucin), as que las comillas no son necesarias al especificar el archivo de
datos en la lnea de comandos. De lo contrario, sera necesario especificar, por ejemplo,
589
Trabajos de produccin
'/data/July_data.sav' para incluir las comillas con la especificacin del archivo de datos, ya
que las especificaciones de archivos deben figurar entre comillas en la sintaxis de comandos.
La palabra clave silent suprime las entradas del usuario en el trabajo de produccin y el
modificador -symbol inserta el nombre y la ubicacin del archivo de datos entre comillas
donde aparece el smbolo del tiempo de ejecucin @datafile en los archivos de sintaxis de
comandos incluidos en el trabajo de produccin.
Los formatos de grficos WMF y EMF no son compatibles. Se utilizar el formato PNG en
su lugar.
Las opciones de exportacin Documento de resultados (sin grficos), Slo grficos y Nada no
son compatibles. Los objetos de resultados compatibles con el formato seleccionado estn
incluidos.
Captulo
52
Puede utilizar el panel de control para iniciar y detener el envo de los resultados a los distintos
destinos.
Cada solicitud de SGR permanece activa hasta que finaliza de forma explcita o hasta el
final de la sesin.
590
591
Sistema de gestin de resultados
Un archivo de destino especificado en una solicitud de SGR no estar disponible para otros
procedimientos y otras aplicaciones hasta que finalice la solicitud de SGR.
Mientras que una solicitud de SGR est activa, los archivos de destino especificados se
almacenan en la memoria (RAM) y, por consiguiente, las solicitudes de SGR activas que
escriben una gran cantidad de resultados en archivos externos pueden consumir una cantidad
considerable de memoria.
Las distintas solicitudes de SGR son independientes. Un mismo resultado se puede enviar
a distintas ubicaciones en formatos diversos que dependen de las especificaciones de las
distintas solicitudes de SGR.
El orden de los objetos de resultados en un destino concreto equivale al orden en que se han
creado, lo cual se determina mediante el orden y el funcionamiento de los procedimientos
que generan los resultados.
Statistics, XML o HTML). Por defecto, se utiliza el formato XML con los resultados. Si desea
obtener ms informacin, consulte Opciones de SGR el p. 596.
E Especifique un destino de resultados:
Basado en nombres de objetos. Los resultados se envan a varios archivos de destino segn los
nombres de objetos. Se crea un archivo independiente para cada objeto de resultados, con un
nombre de archivo basado o en los nombres de subtipo de tabla o en las etiquetas de tabla.
Escriba el nombre de la carpeta de destino.
Nuevo conjunto de datos. En el caso de los resultados con formato de archivo de datos SPSS
Statistics, puede enviar los resultados a un conjunto de datos. El conjunto de datos est
disponible para su uso posterior durante la misma sesin, pero no se guardar a menos
que se haya guardado explcitamente antes de que finalice la sesin. Esta opcin slo est
disponible para los resultados con formato de archivo de datos SPSS Statistics. El nombre de
592
Captulo 52
un conjunto de datos debe cumplir las normas de denominacin de variables. Si desea obtener
ms informacin, consulte Nombres de variable en Captulo 5 el p. 79.
E Si lo desea:
Excluya los resultados seleccionados del Visor. Si selecciona Excluir del Visor, los tipos de
resultados de la solicitud de SGR no se mostrarn en la ventana del Visor. Si varias solicitudes
SGR activas incluyen los mismos tipos de resultados, la presentacin de dichos tipos de
resultados en el Visor se determina mediante la solicitud de SGR ms reciente que contiene
los tipos de resultados. Si desea obtener ms informacin, consulte Exclusin de presentacin
de resultados del Visor el p. 601.
Asigne una cadena de ID a la solicitud. A todas las solicitudes se les asigna automticamente
un valor de ID; puede anular la cadena de ID por defecto del sistema con un ID descriptivo,
que puede resultar til si dispone de varias solicitudes activas que desea identificar fcilmente.
Los valores de ID que asigne no pueden empezar por un signo de dlar ($).
Los siguientes consejos son tiles para seleccionar varios elementos de una lista:
Las solicitudes de SGR activas y nuevas se muestran en la lista Solicitudes con la solicitud ms
reciente en la parte superior. Puede cambiar los anchos de las columnas de informacin si pulsa y
arrastra los bordes, y puede desplazar la lista horizontalmente para ver ms informacin sobre
una solicitud en concreto.
Un asterisco (*) despus de la palabra Activa en la columna Estado indica que se ha creado
una solicitud de SGR con una sintaxis de comandos que incluye funciones no disponibles en
el panel de control.
Para finalizar una solicitud de SGR activa concreta:
E Pulse en cualquier casilla de la fila para dicha solicitud en la lista Solicitudes.
E Pulse en Terminar.
Para eliminar una solicitud nueva (una solicitud que se ha aadido pero que an no est activa):
E Pulse en cualquier casilla de la fila para dicha solicitud en la lista Solicitudes.
E Pulse en Eliminar.
Nota: las solicitudes de SGR activas no finalizan hasta que pulsa en Aceptar.
593
Sistema de gestin de resultados
grficos creados mediante procedimientos estadsticos (por ejemplo, un grfico de barras creado
mediante el procedimiento Frecuencias).
Encabezados. Objetos de texto con la etiqueta Ttulo en el panel de titulares del Visor. No se
puede contener varias vistas del modelo, entre las que se incluyen tablas y grficos.
Tablas. Objetos de resultados que son tablas pivote en el Visor (incluye tablas de notas). Las
tablas son los nicos objetos de resultados que se pueden dirigir al formato del archivo de datos
SPSS Statistics (sav).
Textos. Objetos de texto que no son logaritmos ni encabezados (incluye los objetos con la etiqueta
Resultados de texto en el panel de titulares del Visor).
rboles. Diagramas de modelo de rbol generados por la opcin rbol de decisin.
Advertencias. Los objetos de advertencia contienen determinados tipos de mensajes de error y
advertencia.
594
Captulo 52
Figura 52-2
Tipos de objetos de resultados
Los identificadores de comandos estn disponibles para todos los procedimientos estadsticos y de
grficos y para cualquier otro comando que genere bloques de resultados con su propio encabezado
identificable en el panel de titulares del Visor. Estos identificadores son por lo general (aunque no
siempre) iguales o similares a los nombres de los procedimientos de los mens y los ttulos de los
cuadros de dilogo, los cuales son por lo general (aunque no siempre) similares a los nombres
595
Sistema de gestin de resultados
Los subtipos de tabla son los diferentes tipos de tablas pivote que se pueden generar. Algunos
subtipos slo estn generados por un comando; otros subtipos se pueden generar mediante varios
comandos (aunque las tablas pueden no presentar un aspecto similar). Aunque los nombres
de subtipos de tabla suelen ser bastante descriptivos, puede haber muchos entre los que elegir
(sobre todo si ha seleccionado un nmero considerable de comandos); adems, dos subtipos
pueden tener nombres muy similares.
Para buscar identificadores de comandos y subtipos de tabla
En caso de duda, puede buscar los nombres de los identificadores de comandos y los subtipos de
tabla en la ventana del Visor:
E Ejecute el procedimiento para generar algunos resultados en el Visor.
E Pulse con el botn derecho del ratn en el elemento del panel de titulares del Visor.
E Seleccione Copiar identificador de comandos de SGR o Copiar subtipo de tablas de SGR.
E Pegue el nombre del identificador de comandos o del subtipo de tabla copiado en cualquier editor
Etiquetas
En lugar de los nombres de subtipos de tabla, puede seleccionar tablas basadas en el texto
mostrado en el panel de titulares del Visor. Tambin puede seleccionar otros tipos de objeto
basados en las etiquetas. Las etiquetas resultan tiles para diferenciar varias tablas del mismo
tipo en las que el texto del titular refleja algn atributo del objeto de resultados concreto como las
etiquetas o los nombres de las variables. Hay, no obstante, ciertos factores que pueden afectar al
texto de la etiqueta:
Las etiquetas que incluyen informacin sobre las variables o los valores se ven afectadas
por la configuracin actual de las opciones de las etiquetas de resultados (men Edicin,
Opciones, pestaa Etiquetas de los resultados).
Las etiquetas se ven afectadas por el ajuste actual del idioma de los resultados (men Edicin,
Opciones, pestaa General).
596
Captulo 52
Para especificar las etiquetas que se van a utilizar para identificar los objetos de resultados
E En el panel de control del Sistema de gestin de resultados, seleccione uno o ms tipos de
E Introduzca la etiqueta exactamente como aparece en el panel de titulares de la ventana del Visor.
Tambin puede pulsar con el botn derecho del ratn en el elemento del titular, elegir Copiar
etiqueta de SGR y pegar la etiqueta copiada en el campo de texto Etiqueta.
E Pulse en Aadir.
E Repita el proceso con cada etiqueta de tabla que desee incluir.
E Pulse en Continuar.
Comodines
Puede utilizar un asterisco (*) como ltimo carcter de la cadena de etiqueta y como carcter
comodn. Se seleccionarn todas las etiquetas que empiecen por la cadena especificada (excepto el
asterisco). Este proceso slo funciona si el asterisco es el ltimo carcter, ya que los asteriscos
pueden aparecer como caracteres vlidos en una etiqueta.
Opciones de SGR
Puede utilizar el cuadro de dilogo Opciones de SGR para:
Incluya una variable que identifique el nmero de tabla secuencial que sea el origen en cada
caso (para formato de archivo de datos SPSS Statistics).
597
Sistema de gestin de resultados
Formato
Excel. Formato Excel 97-2003. Las filas, columnas y casillas de tablas pivote se exportan como
filas, columnas y casillas de Excel, con todos los atributos de formato intactos, por ejemplo,
bordes de casilla, estilos de fuente y colores de fondo, etc. Los resultados de texto se exportan con
todos los atributos de fuente intactos. Cada lnea del resultado de texto constituye una fila del
archivo de Excel y se incluye todo su contenido en una sola casilla. Los grficos, diagramas de
rbol y vistas de modelo se incluyen en formato PNG.
HTML. Objetos de resultados que son tablas pivote en el Visor y se convierten en tablas HTML
simples. No se admite ningn atributo de aspecto de tabla (caractersticas de fuente, estilos de
borde, colores, etc.). Los objetos de resultados de texto tienen la etiqueta <PRE> en HTML. Los
grficos, diagramas de rbol y vistas de modelo se exportan como archivos independientes en el
formato grfico seleccionado y se incrustan mediante referencias. Los nombres de archivos de
imagen utilizan el nombre del archivo HTML como nombre raz, seguido de un nmero entero
secuencial, empezando desde 0.
XML con los resultados. XML que se adapta al esquema de resultados de SPSS.
PDF. Los resultados se exportan como aparecen en la presentacin preliminar, con todos los
atributos de formato. El archivo PDF incluye marcadores correspondientes a las entradas del
panel de titulares del Visor.
598
Captulo 52
SPSS Statistics Archivo de datos. Este formato es un formato de archivo binario. Todos los tipos de
objetos de resultados distintos de las tablas se excluyen. Cada columna de una tabla se convierte
en una variable en el archivo de datos. Para utilizar un archivo de datos creado con SGR en la
misma sesin, deber finalizar la solicitud de SGR activa si quiere abrir el archivo de datos. Si
desea obtener ms informacin, consulte Envo de resultados a archivos de datos SPSS Statistics
el p. 602.
Texto. Texto separado por espacios. Los resultados se escriben como texto con los resultados
tabulares alineados con espacios para las fuentes de paso fijo. Los grficos, diagramas de rbol y
vistas de modelo estn excluidos.
Texto con tabulaciones. Texto delimitado por tabulaciones. Para los resultados que se muestran
como tablas pivote en el Visor, las tabulaciones delimitan los elementos de columnas de tabla.
Las lneas de bloque de texto se escriben sin cambios; no se realiza ningn intento de dividirlas
con tabulaciones en las posiciones tiles. Los grficos, diagramas de rbol y vistas de modelo
estn excluidos.
Archivo del Visor. Es el mismo formato empleado para guardar el contenido de la ventana Visor.
Archivo de informe Web. Este formato de archivo de resultados est diseado para su uso con
Predictive Enterprise Services. Es prcticamente igual que el formato del Visor de SPSS Statistics
excepto en que los diagramas de rbol se guardan como imgenes estticas.
Word/RTF. Las tablas pivote se exportan como tablas de Word, con todos los atributos de formato
intactos (por ejemplo, bordes de casilla, estilos de fuente y colores de fondo). Los resultados
de texto se exportan en formato RTF. Los grficos, diagramas de rbol y vistas de modelo se
incluyen en formato PNG.
Imgenes de grficos
Para los formatos HTML y XML de resultados, puede incluir grficos, diagramas de rbol y
vistas de modelo como archivos de imagen. Se crea un archivo de imagen diferente para cada
grfico y/o rbol.
Formato. Los formatos de imagen disponibles son PNG, JPG, EMF, BMP y VML.
el formato EMF (metarchivo mejorado) slo est disponible en los sistemas operativos
Windows.
El formato de imagen VML slo est disponible para el formato de documento HTML.
599
Sistema de gestin de resultados
El formato de imagen VML no crea archivos de imagen adicionales. El cdigo VML que
procesa la imagen est incrustado en el HTML.
Tamao. Puede ajustar la escala del tamao de imagen del 10% al 200%.
Incluir mapas de imagen. Para el formato de documento HTML, esta opcin crea pistas de mapa de
imagen que muestran informacin sobre algunos elementos del grfico, como el valor del punto
seleccionado en un grfico de lneas o de la barra seleccionada en un grfico de barras.
Pivotes de tabla
Para los resultados de las tablas pivote, puede especificar los elementos de dimensin que deben
aparecer en las columnas. El resto de los elementos de dimensin aparecen en las filas. Para el
formato de archivo de datos SPSS Statistics, las columnas de tabla se convierten en variables
y las filas en casos.
Si especifica varios elementos de dimensin para las columnas, estos se anidan en las
columnas en el orden en que aparecen. Para el formato de archivo de datos SPSS Statistics,
los nombres de variable se generan mediante elementos de columna anidados. Si desea
obtener ms informacin, consulte Nombres de variable en los archivos de datos generados
por SGR el p. 609.
Si la tabla no contiene ninguno de los elementos de dimensin que aparecen, todos los
elementos de dimensin para dicha tabla aparecern en las filas.
Los pivotes de tabla especificados aqu no surtirn ningn efecto en las tablas que se muestran
en el Visor.
Cada dimensin de una tabla (fila, columna, capa) puede contener cero o ms elementos. Por
ejemplo, una tabla de contingencia sencilla de dos dimensiones contiene un nico elemento de
dimensin de fila y un nico elemento de dimensin de columna, cada uno de los cuales contiene
una de las variables utilizadas en la tabla. Puede utilizar argumentos de posicin o nombres
de elementos de dimensin para especificar los elementos de dimensin que desea colocar en
la dimensin de columna.
Todas las dimensiones en filas. Crea una fila nica para cada tabla. Para los archivos de datos SPSS
Statistics, significa que cada tabla es un caso nico y que todos los elementos de tabla son variables.
Lista de posiciones. El formato general de un argumento de posicin es una letra que indica la
posicin por defecto del elemento (C para columna, R para fila o L para capa) seguida de un
nmero entero positivo que indica la posicin por defecto en la dimensin. Por ejemplo, R1 indica
el elemento de dimensin de fila ms exterior.
Para especificar varios elementos de diversas dimensiones, separe cada dimensin con un
espacio: por ejemplo, R1 C2.
La letra de dimensin seguida de ALL indica todos los elementos de dicha dimensin en el
orden por defecto. Por ejemplo, CALL equivale al comportamiento por defecto (utilizando
todos los elementos de columna en el orden por defecto para generar columnas).
CALL RALL LALL (o RALL CALL LALL, etc.) coloca los elementos de dimensin en las
columnas. Para el formato de archivo de datos SPSS Statistics, se genera de este modo una
fila o caso por tabla en el archivo de datos.
600
Captulo 52
Figura 52-5
Argumentos de posicin de filas y columnas
elementos de dimensin, que son las etiquetas de texto que aparecen en la tabla. Por ejemplo,
una tabla de contingencia sencilla de do s dimensiones contiene un nico elemento de dimensin
de fila y un nico elemento de dimensin de columna, cada uno de los cuales incluye etiquetas
basadas en las variables de dichas dimensiones adems de un nico elemento de dimensin de
capa con la etiqueta Estadsticos (si el idioma de los resultados es el ingls).
Los nombres de elementos de dimensin pueden variar segn el idioma de los resultados y la
configuracin que influye en la presentacin de los nombres de variable o las etiquetas de
las tablas.
Cada nombre de elemento de dimensin debe aparecer entre comillas simples o dobles. Para
especificar varios nombres de elementos de dimensin, incluya un espacio entre cada nombre
entre comillas.
Las etiquetas asociadas con los elementos de dimensin pueden no ser siempre evidentes.
Para ver todos los elementos de dimensin y sus etiquetas para una tabla pivote
E Active (pulse dos veces en) la tabla en el Visor.
E Elija en los mens:
Ver
Mostrar todo
y/o
E Si los paneles de pivotado no se muestran, elija en los mens:
Pivotar
Paneles de pivotado
601
Sistema de gestin de resultados
Figura 52-6
Nombres de elementos de dimensin mostrados en la tabla y los paneles de pivotado
Registro
Puede registrar la actividad de SGR en un registro de XML o formato de texto.
El registro realiza un seguimiento de todas las solicitudes de SGR nuevas para la sesin, pero
no incluye las solicitudes de SGR activas antes de solicitar un registro.
602
Captulo 52
Adems, puede utilizar esta funcionalidad para suprimir la presentacin de determinados objetos
de resultados que simplemente no desea ver sin enviar ningn otro resultado a un archivo y
formato externos.
Para suprimir la presentacin de determinados objetos de resultados sin dirigir otros resultados a
un archivo externo:
E Cree una solicitud de SGR que identifique los resultados no deseados.
E Seleccione Excluir del Visor.
E Para el destino de los resultados, seleccione Archivo, pero deje el campo Archivo en blanco.
E Pulse en Aadir.
Los resultados seleccionados se excluyen del Visor, mientras que el resto de los resultados se
muestran en el Visor del modo normal.
Las columnas de la tabla son variables en el archivo de datos. Los nombres de variable vlidos
se generan a partir de etiquetas de columna.
Las etiquetas de fila de la tabla se convierten en variables con nombres de variable genrica
(Var1, Var2, Var3, etc.) en el archivo de datos. Los valores de estas variables son etiquetas de
fila en la tabla.
603
Sistema de gestin de resultados
Figura 52-7
Tabla sencilla de dos dimensiones
Las primeras tres variables identifican la tabla de origen por comando, subtipo y etiqueta.
Los dos elementos que definen las filas de la tabla (valores de la variable Sexo y medidas
estadsticas) reciben los nombres de variable genrica Var1 y Var2. Estas dos variables son
variables de cadena.
Las etiquetas de columna de la tabla se utilizan para crear nombres de variable vlidos. En
este caso, dichos nombres de variable se basan en las etiquetas de variable de las tres variables
de escala resumidas en la tabla. Si las variables no tienen etiquetas de variable definidas o
bien ha optado por mostrar los nombres de variable en lugar de las etiquetas de variable como
las etiquetas de columna en la tabla, los nombres de variable del nuevo archivo de datos deben
ser los mismos que los del archivo de datos de origen.
604
Captulo 52
Figura 52-8
Tabla con capas
En la tabla, la variable con la etiqueta Clasificacin tnica define las capas. En el archivo de
datos, se crean dos variables adicionales: una que identifica el elemento de capa y otra que
identifica las categoras del elemento de capa.
Al igual que en el caso de las variables creadas a partir de elementos de fila, las variables
creadas a partir de elementos de capa son variables de cadena con nombres de variable
genrica (el prefijo Var seguido de un nmero secuencial).
Si las etiquetas de columna de las tablas difieren, cada tabla puede aadir variables al archivo
de datos con valores perdidos para los casos de otras tablas que no tienen una columna con un
etiquetado idntico.
Las tablas que contienen las mismas etiquetas de columna suelen generar los archivos de datos ms
tiles de inmediato (archivos de datos que no requieren manipulacin adicional). Por ejemplo, dos
o ms tablas de frecuencia del procedimiento Frecuencias tienen etiquetas de columna idnticas.
605
Sistema de gestin de resultados
Figura 52-9
Dos tablas con etiquetas de columna idnticas
La segunda tabla contribuye con casos adicionales (filas) al archivo de datos, pero no aporta
ninguna variable nueva, dado que las etiquetas de columna son exactamente iguales; por
consiguiente, no hay ningn archivo de revisin de datos perdidos de gran tamao.
Aunque los valores para Comando_ y Subtipo_ son los mismos, el valor Etiqueta_ identifica
la tabla de origen para cada grupo de casos dado que las dos tablas de frecuencia tienen
distintos ttulos.
Se crea una variable nueva en el archivo de datos para cada etiqueta de columna nica en las
tablas que se envan al archivo de datos. Este proceso ofrece como resultado bloques de valores
perdidos si las tablas contienen distintas etiquetas de columna.
606
Captulo 52
Figura 52-10
Dos tablas con distintas etiquetas de columna
La primera tabla tiene columnas con las etiquetas Salario inicial y Salario actual, no presentes
en la segunda tabla, lo que resulta en una serie de valores perdidos para dichas variables
en los casos de la segunda tabla.
Por el contrario, la segunda tabla tiene columnas con las etiquetas Nivel de formacin
acadmica y Meses desde el contrato, no presentes en la primera tabla, lo que resulta en una
serie de valores perdidos para dichas variables en los casos de la primera tabla.
Las variables discordantes como las de este ejemplo se pueden generar incluso con tablas del
mismo subtipo. En este ejemplo, ambas tablas son del mismo subtipo.
607
Sistema de gestin de resultados
Si alguna tabla no tiene el mismo nmero de elementos de fila que otras tablas, no se crear ningn
archivo de datos. El nmero de filas no tiene que ser el mismo; el nmero de elementos de fila que
se convierten en variables en el archivo de datos debe ser el mismo. Por ejemplo, una tabla de
contingencia de dos variables y una tabla de contingencia de tres variables contienen distintos
nmeros de elementos de fila dado que la variable capa est anidada en la variable de fila de la
presentacin de la tabla de contingencia de tres variables por defecto.
Figura 52-11
Tablas con distintos nmeros de elementos de fila
Control de elementos de columna para las variables de control del archivo de datos
En el cuadro de dilogo Opciones del panel de control del Sistema de gestin de resultados puede
especificar qu elementos de dimensin deben estar en las columnas y, por tanto, se utilizan
para crear variables en el archivo de datos generado. Este proceso es equivalente al pivotado de
la tabla en el Visor.
Por ejemplo, el procedimiento Frecuencias genera una tabla de estadsticos descriptivos
con estadsticos en las filas, mientras que el procedimiento Descriptivos genera una tabla de
estadsticos descriptivos con estadsticos en las columnas. Para incluir ambos tipos de tabla en
el mismo archivo de datos de forma significativa, debe cambiar la dimensin de columna de
uno de los tipos de tabla.
Dado que ambos tipos de tabla utilizan el nombre de elemento Estadsticos para la dimensin
de estadsticos, podemos colocar los estadsticos de la tabla de estadsticos Frecuencias en las
columnas si especifica Estadsticos (entre comillas) en la lista de nombres de dimensiones del
cuadro de dilogo Opciones de SGR.
608
Captulo 52
Figura 52-12
Cuadro de dilogo SGR: Opciones
609
Sistema de gestin de resultados
Figura 52-13
Combinacin de distintos tipos de tablas en un archivo de datos mediante el pivotado de elementos de
dimensin
Algunas de las variables incluyen valores perdidos, dado que las estructuras de tabla an no son
exactamente iguales a los estadsticos de las columnas.
A los elementos de fila y capa se les asignan nombres de variable genrica (el prefijo Var
seguido de un nmero secuencial).
Si la etiqueta empieza por un carcter permitido en los nombres de variable, pero no permitido
como primer carcter (por ejemplo, un nmero), se inserta @ como prefijo. Por ejemplo,
2 se convierte en una variable llamada @2.
610
Captulo 52
Los caracteres de subrayado o los puntos al final de las tablas se eliminan de los nombres
de variable resultantes. Los caracteres de subrayado al final de las variables generadas
automticamente Comando_, Subtipo_ y Etiqueta_ no se eliminan.
Figura 52-14
Nombres de variable generados a partir de elementos de tabla
Los identificadores de comandos y subtipos de SGR se utilizan como valores de los atributos
command y subType en OXML. A continuacin se muestra un ejemplo:
Los valores de los atributos command y subType de SGR no se ven afectados por el idioma de
los resultados o la configuracin de presentacin para los nombres de variable y etiquetas o
para los valores y etiquetas de valor.
XML distingue entre maysculas y minsculas. El valor del atributo subType de frequencies
no es igual al valor del atributo subType de Frequencies.
611
Sistema de gestin de resultados
La estructura de tablas en OXML se representa por filas; los elementos que representan las
columnas se anidan en las filas y las casillas individuales se anidan en los elementos de
columna:
<pivotTable...>
<dimension axis='row'...>
<dimension axis='column'...>
<category...>
<cell text='...' number='...' decimals='...'/>
</category>
<category...>
<cell text='...' number='...' decimals='...'/>
</category>
</dimension>
</dimension>
...
</pivotTable>
El ejemplo anterior es una representacin simplificada de la estructura que muestra las relaciones
descendentes/ascendentes de estos elementos. Sin embargo, el ejemplo no muestra necesariamente
las relaciones parentales/filiales, ya que suele haber niveles de elementos anidados intercalados.
La siguiente figura muestra una tabla de frecuencias simple y la representacin completa de
XML con los resultados de dicha tabla.
Figura 52-15
Tabla de frecuencias simple
Figura 52-16
XML con los resultados para la tabla de frecuencias simple
612
Captulo 52
varName=gender variable=true>
<group text=Valid>
<group hide=true text=Dummy>
<category text=Female label=Female string=f
varName=gender>
<dimension axis=column text=Statistics>
<category text=Frequency>
<cell text=216 number=216/>
</category>
<category text=Percent>
<cell text=45.6 number=45.569620253165 decimals=1/>
</category>
<category text=Valid Percent>
<cell text=45.6 number=45.569620253165 decimals=1/>
</category>
<category text=Cumulative Percent>
<cell text=45.6 number=45.569620253165 decimals=1/>
</category>
</dimension>
</category>
<category text=Male label=Male string=m varName=gender>
<dimension axis=column text=Statistics>
<category text=Frequency>
<cell text=258 number=258/>
</category>
<category text=Percent>
<cell text=54.4 number=54.430379746835 decimals=1/>
</category>
<category text=Valid Percent>
<cell text=54.4 number=54.430379746835 decimals=1/>
</category>
<category text=Cumulative Percent>
<cell text=100.0 number=100 decimals=1/>
</category>
</dimension>
</category>
</group>
<category text=Total>
<dimension axis=column text=Statistics>
<category text=Frequency>
<cell text=474 number=474/>
</category>
<category text=Percent>
<cell text=100.0 number=100 decimals=1/>
</category>
<category text=Valid Percent>
<cell text=100.0 number=100 decimals=1/>
</category>
</dimension>
</category>
</group>
</dimension>
613
Sistema de gestin de resultados
</pivotTable>
</command>
</outputTree>
Como puede observar, una tabla sencilla de dimensiones reducidas genera una cantidad
considerable de XML. Esto se debe en parte a que XML contiene informacin no evidente en
la tabla original, informacin que puede no estar disponible en la tabla original y una cantidad
determinada de redundancia.
El contenido de la tabla tal y como aparece (o podra aparecer) en una tabla pivote en el Visor
se incluye en los atributos de texto. A continuacin se muestra un ejemplo:
Los atributos de texto se pueden ver afectados por el idioma de los resultados y la
configuracin que influyen en la presentacin de los nombres de variable y etiquetas o valores
y etiquetas de valor. En este ejemplo, el valor del atributo de texto difiere en funcin del
idioma de los resultados, mientras que el valor del atributo de comando permanece igual
independientemente del idioma de los resultados.
Siempre que las variables o los valores se utilicen en las etiquetas de fila o columna, XML
contiene un atributo de texto y uno o ms valores de atributo adicionales. A continuacin se
muestra un ejemplo:
Para una variable numrica, hay un atributo de nmero en lugar de un atributo de cadena. El
atributo de etiqueta est presente slo si la variable o los valores tienen etiquetas definidas.
Los elementos <cell> que contienen valores de casilla para los nmeros contienen el atributo
de texto> y uno o ms valores de atributo adicionales. A continuacin se muestra un ejemplo:
El atributo de nmero es el valor numrico real sin redondear, mientras que el atributo de
decimales indica el nmero de decimales que se muestran en la tabla.
Dado que las columnas se anidan en las filas, el elemento de categora que identifica cada
columna se repite para cada fila. Por ejemplo, dado que los estadsticos se muestran en las
columnas, el elemento <category text=Frequency> aparece tres veces en XML: una vez para
la fila de hombre, una vez para la fila de mujer y una vez para la fila total.
614
Captulo 52
Identificadores SGR
El objetivo del cuadro de dilogo Identificadores SGR es ofrecerle asistencia en la escritura de la
sintaxis del comando OMS. Se puede utilizar este cuadro de dilogo para pegar los identificadores
de subtipos y comandos seleccionados en una ventana de sintaxis de comandos.
Figura 52-17
Cuadro de dilogo Identificadores SGR
Los identificadores se pegan en la posicin actual del cursor dentro de la ventana de sintaxis
de comandos designada. Si no hay abierta ninguna ventana de sintaxis de comandos, se abrir
automticamente una nueva ventana de sintaxis.
Cuando se pega un identificador de subtipos y/o comandos, ste aparece entre comillas, ya que
la sintaxis del comando OMS exige que as sea.
Las listas de identificadores de las palabras clave COMMANDS y SUBTYPES deben ir entre
corchetes, por ejemplo:
/IF COMMANDS=['Crosstabs' 'Descriptives']
SUBTYPES=['Crosstabulation' 'Descriptive Statistics']
615
Sistema de gestin de resultados
Este mtodo presenta una diferencia respecto al del cuadro de dilogo Identificadores de SGR:
el identificador copiado no se pega automticamente en una ventana de sintaxis de comandos.
Slo tiene que copiar el identificador en el Portapapeles y, a continuacin, podr pegarlo donde
desee. Como los valores de los identificadores de subtipos y comandos son idnticos a los
correspondientes valores de los atributos de subtipos y comandos del formato XML de resultados
(OXML), este mtodo de copiar y pegar puede resultar muy til para escribir transformaciones
XSLT.
Copia de etiquetas SGR
En vez de identificadores, puede copiar etiquetas para utilizarlas con la palabra clave LABELS.
Las etiquetas se pueden utilizar para diferenciar varios grficos o varias tablas del mismo tipo
en las que el texto del titular refleja algn atributo del objeto de resultados concreto como las
etiquetas o los nombres de las variables. Hay, no obstante, ciertos factores que pueden afectar al
texto de la etiqueta:
Las etiquetas que incluyen informacin acerca de variables o valores se ven afectadas por
la configuracin de la presentacin de nombres de variables/etiquetas y valores/etiquetas de
valor del panel de titulares (men Edicin, Opciones, pestaa Etiquetas de los resultados).
Las etiquetas se ven afectadas por el ajuste actual del idioma de los resultados (men Edicin,
Opciones, pestaa General).
Al igual que ocurra con los identificadores de subtipos y comandos, las etiquetas deben ir entre
comillas y toda la lista debe ir entre corchetes, por ejemplo:
/IF LABELS=['Employment Category' 'Education Level']
Apndice
Si tiene archivos de sintaxis de comandos que contienen la sintaxis TABLES que desea convertir
a la sintaxis CTABLES y/o la sintaxis IGRAPH que desea convertir a la sintaxis GGRAPH, se
proporciona un programa de funciones simples para ayudarle a familiarizarse con el proceso de
conversin. Sin embargo, hay diferencias funcionales significativas entre TABLES y CTABLES
y entre IGRAPH y GGRAPH. Es probable que encuentre que el programa de funciones no puede
convertir algunos de sus trabajos de sintaxis TABLES y IGRAPH o que genere sintaxis CTABLES
y GGRAPH que produce tablas y grficos que no se parecen a los originales que generan los
comandos TABLES y IGRAPH. En la mayora de las tablas, puede editar la sintaxis convertida para
producir una tabla que se parezca mucho a la original.
El programa de funciones est diseado para:
Convertir archivos de sintaxis de comandos que siguen a las reglas de sintaxis de modo de
produccin o interactivos.
Esta funcin no puede convertir comandos que contienen errores. Las siguientes limitaciones
tambin son aplicables.
Limitaciones de TABLES.
Nombres de variables entre parntesis con las letras iniciales sta o lab en el subcomando
TABLES si la variable est entre parntesis, por ejemplo, var1 by (statvar) by
(labvar). Se interpretarn como las palabras clave (STATISTICS) y (LABELS).
Los subcomandos SORT que utilizan las abreviaturas A o D que indican su orden ascendente o
descendente. Se interpretarn como nombres de variables.
616
617
Convertidor de sintaxis de los comandos TABLES e IGRAPH
Errores de sintaxis.
Los literales de cadenas divididos en segmentos separados por signos de suma (por ejemplo,
TITLE "Mi" + "ttulo").
Activaciones de macro que, en ausencia de expansin de macro, no sera una sintaxis vlida
TABLES. Como el convertidor no expande las activaciones de macro, las considera como si
fueran parte de la sintaxis estndar de TABLES.
618
Apndice A
Modo de produccin. La unidad de produccin y los comandos en archivos a los que se accede
mediante el comando INCLUDE en un archivo de comandos diferente, utilizan reglas de sintaxis en
modo de produccin:
Se abrir un cuadro de dilogo simple en el que puede especificar los nombres y ubicaciones
de los archivos de sintaxis nuevos y antiguos.
ndice
acceso a un servidor, 68
Access (Microsoft), 18
adicin de etiquetas de grupo, 245
agregacin de datos, 190
agregacin de funciones, 193
nombres y etiquetas de variable, 193
agrupacin, 127
agrupacin de categoras, 127
agrupacin de filas o columnas, 245
ajuste, 252
control de la anchura de la columna para el texto ajustado,
252
etiquetas de variable y de valor, 83
alfa de Cronbach
en Anlisis de fiabilidad, 491, 493
algoritmos, 11
alineacin, 85, 220, 528
en el Editor de datos, 85
resultados, 220, 528
almacenamiento de archivos, 4344
archivos de datos, 4344
archivos de datos SPSS Statistics, 43
consultas del archivo de base de datos, 29
control de ubicaciones de archivos por defecto, 540
almacenamiento de grficos, 225, 236237
archivos BMP, 225, 236
archivos EMF, 225
archivos EPS, 225, 237
archivos JPEG, 225, 236
archivos PICT, 225
archivos PNG, 236
archivos PostScript, 237
archivos TIFF, 237
metarchivos, 225
almacenamiento de resultados, 225, 231, 234
en formato PDF, 225, 233
formato de texto, 225, 234
formato Excel, 225, 229
formato HTML, 225
Formato PowerPoint, 225, 231
formato Word, 225, 228
HTML, 225, 227
almacenamiento en la cach, 66
archivo activo, 66
anlisis alfa, 426
anlisis de componentes principales, 423, 426
anlisis de conglomerados
Anlisis de conglomerados de K-medias, 447
anlisis de conglomerados jerrquico, 441
eficacia, 449
619
620
ndice
anlisis de la varianza
en ANOVA de un factor, 335
en Estimacin curvilnea, 384
en Medias, 319
en Regresin lineal, 374
anlisis de respuestas mltiples
Frecuencias de respuestas mltiples, 473
tabla de contingencia, 475
Tablas de contingencia de respuestas mltiples, 475
tablas de frecuencias, 473
anlisis de series temporales
prediccin, 386
prediccin de casos, 386
Anlisis de vecinos ms prximos, 393
almacenamiento de variables, 402
opciones, 404
particiones, 400
resultados, 403
seleccin de funciones, 398
vecinos, 397
vista de modelos, 405
Anlisis discriminante, 415
almacenamiento de variables de clasificacin, 421
coeficientes de la funcin, 418
criterios, 419
definicin de rangos, 417
Distancia de Mahalanobis, 419
ejemplo, 415
estadsticos, 415, 418
estadsticos descriptivos, 418
exportacin de informacin del modelo, 421
funciones adicionales del comando, 422
grficos, 420
lambda de Wilks, 419
matrices, 418
matriz de covarianzas, 420
mtodos de inclusin por pasos, 415
mtodos discriminantes, 419
opciones de presentacin, 419420
probabilidades previas, 420
seleccin de casos, 417
V de Rao, 419
valores perdidos, 420
variables de agrupacin, 415
variables independientes, 415
Anlisis factorial, 423
conceptos bsicos, 423
convergencia, 426427
descriptivos, 425
ejemplo, 423
estadsticos, 423, 425
formato de presentacin de los coeficientes, 429
funciones adicionales del comando, 430
grficos de saturaciones, 427
mtodos de extraccin, 426
mtodos de rotacin, 427
puntuaciones factoriales, 428
621
ndice
apertura, 1314
Dimensions, 39
informacin sobre el archivo, 42
informacin sobre el diccionario, 42
mejora del rendimiento para archivos grandes, 66
mrInterview, 39
proteccin, 64
Quancept, 39
Quanvert, 39
reestructuracin, 200
servidores remotos, 72
texto, 30
transposicin, 183
varios archivos de datos abiertos, 101, 526
volteado, 183
archivos de dBASE, 13, 16, 4344
almacenamiento, 4344
lectura, 13, 16
archivos de Excel, 13, 15, 44, 548
adicin de elementos de men para enviar datos a Excel,
548
almacenamiento, 4344
almacenamiento de etiquetas de valor en lugar de valores,
43
apertura, 13, 15
archivos de hoja de clculo, 13, 15, 46
apertura, 15
escritura de nombres de variable, 46
lectura de nombres de variables, 15
rangos de lectura, 15
archivos de Lotus 1-2-3, 13, 4344, 548
adicin de elementos de men para enviar datos a Lotus,
548
almacenamiento, 4344
apertura, 13
archivos de SAS
almacenamiento, 43
apertura, 13
archivos de sintaxis de comandos, 283
archivos de sintaxis del comando Unicode, 283
archivos de Stata, 16
almacenamiento, 43
apertura, 16
lectura, 13
archivos delimitados por comas, 30
archivos delimitados por tabuladores, 13, 15, 30, 4344, 46
almacenamiento, 4344
apertura, 13
escritura de nombres de variable, 46
lectura de nombres de variables, 15
archivos EPS, 225, 237
exportacin de grficos, 225, 237
archivos JPEG, 225, 236
exportacin de grficos, 225, 236
archivos PNG, 225, 236
exportacin de grficos, 225, 236
archivos porttiles
nombres de variable, 44
archivos PostScript (encapsulado), 225, 237
exportacin de grficos, 225, 237
archivos spp
conversin a archivos spj, 589
archivos SYSTAT, 13
apertura, 13
archivos TIFF, 237
exportacin de grficos, 225, 237
Asesor estadstico, 10
asignacin de memoria
en Anlisis de conglomerados en dos fases, 436
asignacin de rangos a los casos, 152
percentiles, 153
puntuaciones de Savage, 153
rangos fraccionales, 153
valores empatados, 154
asimetra
en Cubos OLAP, 323
en Descriptivos, 297
en el Informe de estadsticos en columnas, 486
en el Informe de estadsticos en filas, 481
en Explorar, 301
en Frecuencias, 292
en Medias, 319
en Resumir, 314
asociacin lineal por lineal
en Tablas de contingencia, 307
Aspectos de tabla, 250251
aplicacin, 250
creacin, 251
atributos
atributos de variable personalizados, 86
atributos de variable, 8586
copia y pegado, 8586
personalizados, 86
atributos de variable personalizados, 86
atributos personalizados, 86
autoprocesos, 541
autovalores
en Anlisis factorial, 425426
en Regresin lineal, 374
ayuda en pantalla, 11
Asesor estadstico, 10
barra de estado, 6
barras de herramientas, 549, 551552
creacin, 549, 551
creacin de nuevas herramientas, 552
personalizacin, 549, 551
presentacin en distintas ventanas, 551
presentacin y ocultacin, 549
bases de datos, 1718, 20, 2223, 25, 27, 29
actualizacin, 50
adicin de nuevos campos a una tabla, 59
adicin de nuevos registros (casos) a una tabla, 60
622
ndice
almacenamiento, 50
almacenamiento de consultas, 29
clusula Where, 23
consultas de parmetros, 23, 25
conversin de cadenas en variables numricas, 27
creacin de relaciones, 22
creacin de una tabla nueva, 61
definicin de variables, 27
especificacin de criterios, 23
expresiones condicionales, 23
lectura, 1718, 20
Microsoft Access, 18
muestreo aleatorio, 23
Pedir el valor al usuario, 25
seleccin de campos de datos, 20
seleccin de un origen de datos, 18
sintaxis de SQL, 29
sustitucin de los valores de los campos existentes, 58
sustitucin de una tabla, 61
uniones entre tablas, 22
verificacin de los resultados, 29
bondad de ajuste
en regresin ordinal, 380
Bonferroni
en ANOVA de un factor, 337
en MLG, 348
bordes, 256, 263
presentacin de bordes ocultos, 263
botn Aceptar, 8
botn Ayuda, 8
botn Cancelar, 8
botn Pegar, 8
botn Restablecer, 8
buscar y reemplazar
documentos del visor, 223
C de Dunnett
en ANOVA de un factor, 337
en MLG, 348
clculo de variables, 136
clculo de variables de cadena nuevas, 138
Cambiar valores, 143
cambio del nombre de los conjuntos de datos, 104
cambio del orden de filas y columnas, 244
capas, 237, 246, 248, 252, 257
creacin, 246
en las tablas pivote, 246
en Tablas de contingencia, 307
impresin, 237, 252, 257
presentacin, 246, 248
casillas de las tablas pivote, 254, 262263
anchuras, 263
formatos, 254
ocultacin, 249
presentacin, 249
casos, 94, 200
bsqueda de duplicados, 124
623
ndice
624
ndice
en Frecuencias, 292
en Medias, 319
en Resumir, 314
Curva COR, 506
estadsticos y grficos, 507
d
en Tablas de contingencia, 307
d de Somers
en Tablas de contingencia, 307
DATA LIST, 65
frente al comando GET DATA, 65
datos categricos, 110
conversin de datos de intervalo en categoras discretas,
127
Datos de Dimensions, 39
almacenamiento, 63
datos de serie temporal
creacin de nuevas variables de serie temporal, 172
definicin de variables de datos, 171
funciones de transformacin, 173
sustitucin de valores perdidos, 175
transformaciones de los datos, 170
datos delimitados por espacios, 30
datos ponderados, 216
y de datos reestructurados, 216
definicin de variables, 78, 80, 8286, 107
aplicacin de un diccionario de datos, 116
copia y pegado de atributos, 8586
etiquetas de valor, 83, 107
etiquetas de variable, 82
plantillas, 8586
tipos de datos, 80
valores perdidos, 84
definir conjuntos de respuestas mltiples, 472
categoras, 472
dicotomas, 472
etiquetas del conjunto, 472
nombres del conjunto, 472
dendrogramas
en Anlisis de conglomerados jerrquico, 445
descomposicin jerrquica, 345
Descriptivos, 296
almacenamiento de puntuaciones z, 296
estadsticos, 297
funciones adicionales del comando, 298
orden de presentacin, 297
desplazamiento de filas y columnas, 244
desviacin absoluta promedio (DAP)
en Estadsticos de la razn, 504
desviacin tpica
en Cubos OLAP, 323
en Descriptivos, 297
en el Informe de estadsticos en columnas, 486
en el Informe de estadsticos en filas, 481
en Estadsticos de la razn, 504
en Explorar, 301
en Frecuencias, 292
en Medias, 319
en MLG Univariante, 352
en Resumir, 314
DfAjuste
en Regresin lineal, 371
DfBeta
en Regresin lineal, 371
diagnsticos de colinealidad
en Regresin lineal, 374
diagnsticos por caso
en Regresin lineal, 374
diagramas de caja
comparacin de niveles del factor, 302
comparacin de variables, 302
en Explorar, 302
diagramas de dispersin
en Regresin lineal, 370
diagramas de dispersin por nivel
en Explorar, 302
en MLG Univariante, 352
diagramas de tmpanos
en Anlisis de conglomerados jerrquico, 445
diario de la sesin, 540
diccionario, 42
Libro de cdigos, 284
diccionario de datos
aplicar desde otro archivo, 116
diferencia honestamente significativa de Tukey
en ANOVA de un factor, 337
en MLG, 348
diferencia menos significativa
en ANOVA de un factor, 337
en MLG, 348
diferencial relativo al precio (DRP)
en Estadsticos de la razn, 504
diferencias entre grupos
en Cubos OLAP, 326
diferencias entre variables
en Cubos OLAP, 326
directorio temporal, 540
definir ubicacin en modo local, 540
variable de entorno SPSSTMPDIR, 540
distancia chi-cuadrado
en Distancias, 364
distancia de bloques
en Distancias, 364
distancia de bloques de ciudad
en Anlisis de vecinos ms prximos, 397
distancia de Chebychev
en Distancias, 364
Distancia de Cook
en MLG, 350
en Regresin lineal, 371
Distancia de Mahalanobis
en Anlisis discriminante, 419
en Regresin lineal, 371
625
ndice
Distancia de Manhattan
en Anlisis de vecinos ms prximos, 397
distancia de Minkowski
en Distancias, 364
Distancia eucldea
en Anlisis de vecinos ms prximos, 397
en Distancias, 364
distancia eucldea al cuadrado
en Distancias, 364
Distancias, 362
clculo de distancias entre casos, 362
clculo de distancias entre variables, 362
ejemplo, 362
estadsticos, 362
funciones adicionales del comando, 366
medidas de disimilaridad, 364
medidas de similaridad, 365
transformacin de medidas, 364365
transformacin de valores, 364365
distancias de vecinos ms prximos
en Anlisis de vecinos ms prximos, 409
divisin
divisin entre columnas del informe, 487
divisor de paneles
Editor de datos, 99
divisor de ventanas
Editor de datos, 99
DMS de Fisher
en MLG, 348
edicin de datos, 9394
Editor de datos, 76, 78, 85, 9195, 98100, 548
alineacin, 85
ancho de columna, 85
cambiar tipo de datos, 95
casos filtrados, 98
definicin de variables, 78
desplazamiento de variables, 95
edicin de datos, 9394
envo de datos a otras aplicaciones, 548
impresin, 100
insercin de nuevas variables, 95
insercin de nuevos casos, 94
introduccin de datos, 91
introduccin de datos no numricos, 92
introduccin de datos numricos, 92
opciones de presentacin, 99
restricciones de los valores de datos, 93
varias vistas/paneles, 99
varios archivos de datos abiertos, 101, 526
Vista de datos, 76
Vista de variables, 77
Editor de grficos, 513
propiedades, 514
editor de sintaxis, 274
amplitudes de comando, 275
autocompletar, 277
626
ndice
estimador-M de Huber
en Explorar, 301
Estimador-M redescendente de Hampel
en Explorar, 301
Estimadores robustos centrales
en Explorar, 301
estudio de control de casos
Prueba T para muestras relacionadas, 331
estudio de pares relacionados
en Prueba T para muestras relacionadas, 331
eta
en Medias, 319
en Tablas de contingencia, 307
eta-cuadrado
en Medias, 319
en MLG Univariante, 352
etiquetas, 245
eliminacin, 245
frente a nombres de subtipos en SGR, 595
insercin de etiquetas de grupo, 245
etiquetas de grupo, 245
etiquetas de valor, 83, 92, 99, 107, 533
almacenamiento en archivos de Excel, 43
aplicacin a varias variables, 112
copia, 112
en archivos de datos fusionados, 187
en el Editor de datos, 99
en el panel de titulares, 533
en las tablas pivote, 533
insercin de saltos de lnea, 83
uso para entrada de datos, 92
etiquetas de variable, 82, 526, 533
de los cuadros de dilogo, 6, 526
en archivos de datos fusionados, 187
en el panel de titulares, 533
en las tablas pivote, 533
insercin de saltos de lnea, 83
exclusin de resultados del Visor con SGR, 601
EXECUTE (comando)
pegado desde cuadros de dilogo, 283
Explorar, 300
estadsticos, 301
funciones adicionales del comando, 304
grficos, 302
opciones, 303
transformaciones de potencia, 303
valores perdidos, 303
exportacin
modelos, 269
exportacin de datos, 548
adicin de elementos de men para exportar datos, 548
exportacin de grficos, 225, 236237, 581
produccin automatizada, 581
exportacin de resultados, 225, 231, 234
en formato PDF, 225, 233, 596
formato de texto, 596
formato Excel, 225, 229, 596
627
ndice
628
ndice
629
ndice
kappa de Cohen
en Tablas de contingencia, 307
KR20
en Anlisis de fiabilidad, 493
Kuder-Richardson 20 (KR20)
en Anlisis de fiabilidad, 493
LAG (funcin), 173
lambda
en Tablas de contingencia, 307
lambda de Goodman y Kruskal
en Tablas de contingencia, 307
lambda de Wilks
en Anlisis discriminante, 419
lengua
cambio del idioma de la interfaz de usuario, 526
cambio del idioma de los resultados, 526
lenguaje de comandos, 270
Libro de cdigos, 284
estadsticos, 289
resultados, 286
lneas de cuadrcula, 263
tablas pivote, 263
listado de casos, 312
listas de destino, 524
listas de variables, 524
reordenacin de listas de destino, 524
mapa de cuadrantes
en Anlisis de vecinos ms prximos, 410
matriz de configuracin
en Anlisis factorial, 423
matriz de correlaciones
en Anlisis discriminante, 418
en Anlisis factorial, 423, 425
en regresin ordinal, 380
matriz de covarianzas
en Anlisis discriminante, 418, 420
en MLG, 350
en Regresin lineal, 374
en regresin ordinal, 380
matriz de transformacin
en Anlisis factorial, 423
mxima verosimilitud
en Anlisis factorial, 426
mximo
comparacin de columnas del informe, 487
en Cubos OLAP, 323
en Descriptivos, 297
en Estadsticos de la razn, 504
en Explorar, 301
en Frecuencias, 292
en Medias, 319
en Resumir, 314
media
de varias columnas del informe, 487
630
ndice
medidas de distancia
en Anlisis de conglomerados jerrquico, 443
en Anlisis de vecinos ms prximos, 397
en Distancias, 364
medidas de distribucin
en Descriptivos, 297
en Frecuencias, 292
medidas de similaridad
en Anlisis de conglomerados jerrquico, 443
en Distancias, 365
medidas de tendencia central
en Estadsticos de la razn, 504
en Explorar, 301
en Frecuencias, 292
memoria, 526
mens, 548
personalizacin, 548
metarchivos, 225
exportacin de grficos, 225
mtodos de seleccin, 264
seleccin de filas y columnas en tablas pivote, 264
Microsoft Access, 18
mnimo
comparacin de columnas del informe, 487
en Cubos OLAP, 323
en Descriptivos, 297
en Estadsticos de la razn, 504
en Explorar, 301
en Frecuencias, 292
en Medias, 319
en Resumir, 314
mnimos cuadrados generalizados
en Anlisis factorial, 426
mnimos cuadrados no ponderados
en Anlisis factorial, 426
mnimos cuadrados ponderados
en Regresin lineal, 367
MLG
almacenamiento de matrices, 350
almacenamiento de variables, 350
contrastes post hoc, 348
grficos de perfil, 347
modelo, 344
suma de cuadrados, 344
MLG Univariante, 342, 353
contrastes, 346
diagnsticos, 352
medias marginales estimadas, 352
opciones, 352
presentacin, 352
moda
en Frecuencias, 292
modelo compuesto
en Estimacin curvilnea, 386
modelo cuadrtico
en Estimacin curvilnea, 386
631
ndice
modelo cbico
en Estimacin curvilnea, 386
modelo de crecimiento
en Estimacin curvilnea, 386
modelo de curva S
en Estimacin curvilnea, 386
modelo de escala
en regresin ordinal, 382
modelo de Guttman
en Anlisis de fiabilidad, 491, 493
modelo de potencia
en Estimacin curvilnea, 386
modelo de ubicacin
en regresin ordinal, 381
modelo estrictamente paralelo
en Anlisis de fiabilidad, 491, 493
modelo exponencial
en Estimacin curvilnea, 386
modelo inverso
en Estimacin curvilnea, 386
modelo lineal
en Estimacin curvilnea, 386
modelo logartmico
en Estimacin curvilnea, 386
modelo logstico
en Estimacin curvilnea, 386
modelo paralelo
en Anlisis de fiabilidad, 491, 493
modelos, 267
activacin, 267
copia, 269
exportacin, 269
impresin, 269
interactuacin, 267
propiedades, 268
Visor de modelo, 267
modelos factoriales completos
en MLG, 344
modelos personalizados
en MLG, 344
modificadores de la lnea de comando, 588
Trabajos de produccin, 588
modo distribuido, 6869, 72, 74
acceso a un archivo de datos, 72
procedimientos disponibles, 74
rutas relativas, 74
mrInterview, 39
muestra aleatoria, 23
bases de datos, 23
seleccin, 197
semilla de aleatorizacin, 140
muestra de entrenamiento
en Anlisis de vecinos ms prximos, 400
muestra reservada
en Anlisis de vecinos ms prximos, 400
muestras relacionadas, 464, 469
muestreo
muestra aleatoria, 197
multiplicacin
multiplicacin entre columnas del informe, 487
Newman-Keuls
en MLG, 348
nivel de medida, 80, 110
definicin, 80
iconos de los cuadros de dilogo, 8
nombres de variable, 79, 526
ajuste de los nombres largos de variable en los resultados,
79
archivos porttiles, 44
de los cuadros de dilogo, 6, 526
generados por SGR, 609
nombres de variable de casos mixtos, 79
reglas, 79
truncado de nombres de variable largos en versiones
anteriores, 44
nominal, 80
nivel de medida, 80, 110
notacin cientfica, 80, 526
supresin en resultados, 526
notas al pie, 253, 261263
grficos, 516
marcadores, 253, 262
renumerar, 263
nuevas funciones
versin 17.0, 2
numeracin de pginas, 240
en el informe de estadsticos en columnas, 489
en informes de estadsticos en filas, 482
nmero de casos
en Cubos OLAP, 323
en Medias, 319
en Resumir, 314
nmero mximo de ramas
en Anlisis de conglomerados en dos fases, 436
nmeros de puerto, 69
ocultacin, 219, 249250, 262, 549
barras de herramientas, 549
etiquetas de dimensin, 250
filas y columnas, 249
notas al pie, 262
resultados de un procedimiento, 219
textos al pie, 262
ttulos, 250
ocultacin (exclusin) de resultados del Visor con SGR,
601
opciones, 526, 528529, 532533, 535, 538, 540541, 544
aos de dos dgitos, 529
aspecto de tablas pivote, 538
datos, 529
directorio temporal, 540
editor de sintaxis, 544
632
ndice
633
ndice
634
ndice
puntuacin
carga de modelos guardados, 177
modelos admitidos para exportar y puntuar, 176
visualizacin de modelos cargados, 180
puntuaciones de Savage, 153
puntuaciones factoriales, 428
puntuaciones factoriales de Anderson-Rubin, 428
puntuaciones factoriales de Bartlett, 428
puntuaciones normales
en la asignacin de rangos a los casos, 153
puntuaciones z
almacenamiento como variables, 296
en Descriptivos, 296
en la asignacin de rangos a los casos, 153
Q de Cochran
en pruebas para varias muestras relacionadas, 469
Quancept, 39
Quanvert, 39
R mltiple
en Regresin lineal, 374
R-E-G-W F
en ANOVA de un factor, 337
en MLG, 348
R-E-G-W Q
en ANOVA de un factor, 337
en MLG, 348
R2
Cambio en R2, 374
en Medias, 319
en Regresin lineal, 374
R2 ajustado
en Regresin lineal, 374
R2 de Cox y Snell
en regresin ordinal, 380
R2 de McFadden
en regresin ordinal, 380
R2 de Nagelkerke
en regresin ordinal, 380
Rachas de Wald-Wolfowitz
en Pruebas para dos muestras independientes, 462
rango
en Cubos OLAP, 323
en Descriptivos, 297
en Estadsticos de la razn, 504
en Frecuencias, 292
en Medias, 319
en Resumir, 314
rango mltiple de Ryan-Einot-Gabriel-Welsch
en ANOVA de un factor, 337
en MLG, 348
razn entre covarianzas
en Regresin lineal, 371
recodificacin de los valores, 127, 144145, 147149
recuento de apariciones, 141
recuento esperado
en Tablas de contingencia, 310
recuento observado
en Tablas de contingencia, 310
reestructuracin de los datos, 200, 203205, 207212,
214216
conceptos bsicos, 200
creacin de una nica variable de ndice para variables
a casos, 209
creacin de variables de ndice para variables a casos,
207
creacin de varias variables de ndice para variables
a casos, 210
ejemplo de casos a variables, 204
ejemplo de dos ndices para variables a casos, 209
ejemplo de un ndice para variables a casos, 208
ejemplo de variables a casos, 203
grupos de variables para variables a casos, 204
opciones para casos a variables, 215
opciones para variables a casos, 211
ordenacin de los datos para reestructurar casos a
variables, 214
seleccin de datos para reestructurar casos a variables,
212
seleccin de datos para reestructurar variables a casos,
205
tipos de reestructuracin, 200
y datos ponderados, 216
regresin
grficos, 370
Regresin lineal, 367
regresin mltiple, 367
Regresin de mnimos cuadrados parciales, 388
exportar variables, 391
modelo, 390
Regresin lineal, 367
almacenamiento de nuevas variables, 371
bloques, 367
estadsticos, 374
exportacin de informacin del modelo, 371
funciones adicionales del comando, 376
grficos, 370
mtodos de seleccin de variables, 368, 375
ponderaciones, 367
residuos, 371
valores perdidos, 375
variable de seleccin, 370
regresin mltiple
en Regresin lineal, 367
Regresin ordinal, 377
estadsticos, 377
funciones adicionales del comando, 383
modelo de escala, 382
modelo de ubicacin, 381
opciones, 378
vnculo, 378
relacin de aspecto, 535
635
ndice
rendimiento, 66
cach de datos, 66
residuos
almacenamiento en Estimacin curvilnea, 386
almacenamiento en Regresin lineal, 371
en Tablas de contingencia, 310
residuos de Pearson
en regresin ordinal, 380
residuos eliminados
en MLG, 350
en Regresin lineal, 371
residuos estudentizados
en Regresin lineal, 371
residuos no tipificados
en MLG, 350
residuos tipificados
en MLG, 350
en Regresin lineal, 371
Respuesta mltiple
funciones adicionales del comando, 478
resultados, 218220, 224225, 241, 528
alineacin, 220, 528
almacenamiento, 241
cambio del idioma de los resultados, 526
centrado, 220, 528
copia, 219
copia en otras aplicaciones, 225
desplazamiento, 219
eliminacin, 219
exportacin, 225
ocultacin, 219
pegado en otras aplicaciones, 224
presentacin, 219
Visor, 218
resultados de grficos, 225
resumen de error
en Anlisis de vecinos ms prximos, 414
Resumir, 312
estadsticos, 314
opciones, 314
rho
en Correlaciones bivariadas, 355
en Tablas de contingencia, 307
riesgo
en Tablas de contingencia, 307
riesgo relativo
en Tablas de contingencia, 307
rotacin de etiquetas, 245
rotacin equamax
en Anlisis factorial, 427
rotacin oblimin directa
en Anlisis factorial, 427
rotacin quartimax
en Anlisis factorial, 427
rotacin varimax
en Anlisis factorial, 427
rupturas de tabla, 265
S-stress
en Escalamiento multidimensional, 496
saltos de lnea
etiquetas de variable y de valor, 83
seleccin de casos, 195
muestra aleatoria, 197
rango de casos, 198
rango de fechas, 198
rango de horas, 198
segn criterios de seleccin, 197
seleccin de funciones
en Anlisis de vecinos ms prximos, 411
seleccin de funciones y k
en Anlisis de vecinos ms prximos, 413
seleccin de k
en Anlisis de vecinos ms prximos, 412
seleccin hacia delante
en Anlisis de vecinos ms prximos, 398
en Regresin lineal, 368
seleccin por pasos
en Regresin lineal, 368
seleccionar casos, 195
semilla de aleatorizacin, 140
separacin de tablas, 265
control de las rupturas de tabla, 265
servidores, 6869
acceso, 68
adicin, 69
edicin, 69
nombres, 69
nmeros de puerto, 69
servidores remotos, 6869, 72, 74
acceso, 68
acceso a un archivo de datos, 72
adicin, 69
edicin, 69
procedimientos disponibles, 74
rutas relativas, 74
SGR, 590, 614
control de pivotes de tabla, 596, 607
en formato PDF, 596
exclusin de resultados del Visor, 601
Formato de archivo de datos SPSS Statistics, 596, 602
formato de archivo SAV, 596, 602
formato de texto, 596
formato Excel, 596
formato Word, 596
identificadores de comandos, 594
nombres de variable en los archivos SAV, 609
subtipos de tabla, 594
tipos de objetos de resultados, 593
Uso de XSLT con OXML, 615
XML, 596, 610
sintaxis, 270, 281, 551, 581
acceso a Command Syntax Reference, 11
anotaciones de los resultados, 273
archivo de diario, 283
636
ndice
en MLG, 348
tabla de clasificacin
en Anlisis de vecinos ms prximos, 413
tabla de claves, 188
tabla de contingencia
en Tablas de contingencia, 305
respuesta mltiple, 475
tablas, 265
alineacin, 260
color de fondo, 259
control de las rupturas de tabla, 265
conversin de sintaxis del comando TABLES a
CTABLES, 616
fuentes, 259
mrgenes, 260
propiedades de casilla, 259260
tablas anchas
pegado en Microsoft Word, 224
tablas de contingencia, 305
Tablas de contingencia, 305
capas, 307
estadsticos, 307
formatos, 311
grficos de barras agrupadas, 307
ponderaciones fraccionarias, 199
presentacin de casillas, 310
supresin de tablas, 305
variables de control, 307
Tablas de contingencia de respuestas mltiples, 475
definicin de rangos de valores, 476
emparejamiento de las variables entre los conjuntos de
respuestas, 477
porcentajes basados en casos, 477
porcentajes basados en respuestas, 477
porcentajes de casilla, 477
valores perdidos, 477
tablas de frecuencias
en Explorar, 301
en Frecuencias, 291
tablas personalizadas
conversin de sintaxis del comando TABLES a
CTABLES, 616
tablas pivote, 219, 224225, 237, 243246, 249250,
252254, 256257, 263266, 538
agrupacin de filas o columnas, 245
ajustes en la anchura de columna por defecto, 538
alineacin, 260
anchuras de casillas, 263
aspecto por defecto para las tablas nuevas, 538
bordes, 256
cambio del aspecto, 250
cambio del orden de presentacin, 244
capas, 246
color de fondo, 259
control de las rupturas de tabla, 265
copia en otras aplicaciones, 225
creacin de grficos a partir de tablas, 266
637
ndice
638
ndice
639
ndice
Vista de variables, 77
personalizacin, 90, 531
W de Kendall
en pruebas para varias muestras relacionadas, 469
XML
almacenamiento de resultados como XML, 590
envo de resultados a XML, 596
estructura de tablas en OXML, 610
Resultados OXML del SGR, 615
XSLT
uso con OXML, 615
Z de Kolmogorov-Smirnov
en Prueba de Kolmogorov-Smirnov para una muestra,
459
en Pruebas para dos muestras independientes, 462