Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Manual SPSS 14.0
Manual SPSS 14.0
Si desea obtener ms informacin sobre los productos de software de SPSS, visite nuestra pgina Web en http://www.spss.com
o pngase en contacto con
SPSS Inc.
233 South Wacker Drive, 11th Floor
Chicago, IL 60606-6412 EE.UU.
Tel: (312) 651-3000
Fax: (312) 651-3668
SPSS es una marca registrada; los dems nombres de productos son marcas comerciales de SPSS Inc. para los programas de
software de su propiedad. El material descrito en este software no puede ser reproducido ni distribuido sin la autorizacin
expresa por escrito por parte de los propietarios de la marca registrada y de los derechos de la licencia en el software y en
los copyrights de los materiales publicados.
El SOFTWARE y la documentacin se proporcionan con DERECHOS LIMITADOS. Su uso, duplicacin o revelacin por
parte del Gobierno estn sujetos a las restricciones establecidas en la subdivisin (c) (1) (ii) de la clusula Rights in Technical
Data and Computer Software en 52.227-7013. El fabricante es SPSS Inc., 233 South Wacker Drive, 11th Floor, Chicago, IL
60606-6412, EE.UU.
Aviso general: El resto de los nombres de productos mencionados en este documento se utilizan slo con fines identificativos y
pueden ser marcas comerciales de sus respectivas empresas.
TableLook es una marca comercial de SPSS Inc.
Windows es una marca comercial registrada de Microsoft Corporation.
DataDirect, DataDirect Connect, INTERSOLV y SequeLink son marcas comerciales registradas de DataDirect Technologies.
Algunas partes de este producto se han creado utilizando LEADTOOLS 19912000, LEAD Technologies, Inc. TODOS
LOS DERECHOS RESERVADOS.
LEAD, LEADTOOLS y LEADVIEW son marcas comerciales registradas de LEAD Technologies, Inc.
Sax Basic es una marca comercial de Sax Software Corporation. Copyright 19932004 de Polar Engineering and Consulting.
Todos los derechos reservados.
Algunas partes de este producto estn basadas en el trabajo de FreeType Team (http://www.freetype.org).
Una parte del software de SPSS contiene tecnologa zlib. Copyright 19952002 de Jean-loup Gailly y Mark Adler. El software
zlib se proporciona tal cual, sin ningn tipo de garanta implcita o explcita.
Una parte del software de SPSS contiene bibliotecas de Sun Java Runtime. Copyright 2003 de Sun Microsystems, Inc.
Reservados todos los derechos. Las bibliotecas de Sun Java Runtime incluyen cdigo con licencia de RSA Security, Inc.
Algunas partes de las bibliotecas tienen licencia de IBM y estn disponibles en http://oss.software.ibm.com/icu4j/.
Manual del usuario de SPSS Base 14.0
Copyright 2005 de SPSS Inc.
Reservados todos los derechos.
Impreso en Estados Unidos de Amrica.
Queda prohibida la reproduccin, el almacenamiento en sistemas de recuperacin o la transmisin de cualquier parte de esta
publicacin en cualquier forma y por cualquier medio (electrnico o mecnico, fotocopia, grabacin o cualquier otro) sin
previa autorizacin expresa y por escrito de parte del editor.
1 2 3 4 5 6 7 8 9 0 08 07 06 05
ISBN 1-56827-683-4
Prefacio
SPSS 14.0
SPSS 14.0 es un sistema global para el anlisis de datos. SPSS puede adquirir datos
de casi cualquier tipo de archivo y utilizarlos para generar informes tabulares,
grficos y diagramas de distribuciones y tendencias, estadsticos descriptivos y
anlisis estadsticos complejos.
Este manual, Manual del usuario de SPSS Base 14.0, proporciona la
documentacin sobre la interfaz grfica de usuario de SPSS para Windows. Los
ejemplos que utilizan procedimientos estadsticos que se encuentran en SPSS
Base 14.0 se suministran en el sistema de ayuda que se instala con el software. Los
algoritmos utilizados en los procedimientos estadsticos se proporcionan en formato
PDF y estn disponibles en el men Ayuda.
Asimismo, adems de los mens y los cuadros de dilogos, SPSS utiliza un
lenguaje de comandos. Algunas de las funciones avanzadas del sistema slo son
accesibles a travs de la sintaxis de comandos. (Dichas funciones no estn disponibles
en la versin para estudiantes.) La informacin de referencia detallada sobre la
sintaxis de comandos est disponible en dos formatos: integrada en el sistema de
ayuda global y como un documento independientes en formato PDF en SPSS 14.0
Command Syntax Reference, tambin disponible desde el men Ayuda.
SPSS Opciones
Las siguientes opciones estn disponibles como mejoras adicionales de la versin
completa (no la versin para estudiantes) SPSS Base del sistema:
SPSS Modelos de regresin proporciona tcnicas para analizar los datos que no
diferentes atributos del producto afectan a las preferencias de los consumidores y los
ciudadanos. Con SPSS Anlisis conjunto se puede medir con facilidad el efecto
sobre el equilibrio de cada uno de los atributos de un producto dentro del contexto
del conjunto de atributos del producto, tal como hacen los consumidores cuando
deciden lo que van a comprar.
SPSS Pruebas exactas calcula los valores p exactos (valores de significacin) para
las pruebas estadsticas en aquellos casos en los que las muestras son pequeas o
se distribuyen de forma poco uniforme y puedan hacer que las pruebas habituales
resulten poco precisas.
SPSS Anlisis de valores perdidos describe los patrones de los datos perdidos,
realiza una estimacin de las medias y otros estadsticos y permite imputar los valores
a las observaciones perdidas.
SPSS Mapas transforma los datos distribuidos geogrficamente en mapas de
alta calidad, con smbolos, colores, grficos de barras, grficos de sectores y
combinaciones de temas, para representar no slo lo que est ocurriendo sino tambin
dnde tiene lugar.
SPSS Muestras complejas permite a los analistas de encuestas, mercado, salud y
opinin pblica, as como a los socilogos que utilizan una metodologa de encuesta
de ejemplo, incorporar los diseos de muestras complejas al anlisis de datos.
iv
Para instalar el sistema SPSS Base, ejecute el Asistente para autorizacin de licencia
utilizando el cdigo de autorizacin que le envi SPSS Inc. Para obtener ms
informacin, consulte las instrucciones de instalacin proporcionadas con el
sistema SPSS Base.
Compatibilidad
Nmeros de serie
SPSS Inc. ofrece cursos de preparacin, tanto pblicos como in situ. En todos
los cursos habr talleres prcticos. Estos cursos tendrn lugar peridicamente en
las principales capitales. Si desea obtener ms informacin sobre estos cursos,
pngase en contacto con su oficina local que encontrar en la pgina Web de SPSS en
http://www.spss.com/worldwide.
Asistencia tcnica
Sus comentarios son importantes. Hganos saber su experiencia con los productos
SPSS. Nos interesa especialmente recibir noticias sobre aplicaciones nuevas
e interesantes para el sistema SPSS Base. Envenos un correo electrnico a
suggest@spss.com o escriba a SPSS Inc., Attn.: Director of Product Planning, 233
South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, EE.UU.
Acerca de este manual
vii
Contenido
1
Resumen
Obtencin de ayuda
17
ix
25
Archivos de datos
83
Editor de datos
95
Vista de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Vista de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Introduccin de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Edicin de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Ir a caso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Estado de seleccin de casos en el Editor de datos . . . . . . . . . . . . . . . . . 116
Editor de datos: Opciones de presentacin . . . . . . . . . . . . . . . . . . . . . . . . 116
Impresin en el Editor de datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
119
Preparacin de datos
123
xi
161
215
xii
263
Visor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
Uso de los resultados en otras aplicaciones . . . . . . . . . . . . . . . . . . . . . . . 272
Pegado de objetos en el Visor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
Pegado especial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
Para pegar un objeto de otra aplicacin en el Visor . . . . . . . . . . . . . . . . . 276
Exportar resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
Impresin de documentos del Visor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
Almacenamiento de resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
11 Visor de borrador
299
12 Tablas pivote
309
xiii
Sealizadores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
Presentacin y ocultacin de casillas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
Edicin de los resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
Cambio del aspecto de las tablas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
Propiedades de tabla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
Para modificar las propiedades de las tablas pivote . . . . . . . . . . . . . . . . . 323
Propiedades de tabla: General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
Propiedades de tabla: Notas al pie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
Propiedades de tabla: Formatos de casilla . . . . . . . . . . . . . . . . . . . . . . . . 326
Propiedades de tabla: Bordes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
Propiedades de tabla: Imprimiendo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330
Fuente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331
Anchos de casillas de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
Propiedades de casilla . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
Propiedades de casilla: Valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
Propiedades de casilla: Alineacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
Propiedades de casilla: Mrgenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
Propiedades de casilla: Sombreado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
Marcador de nota al pie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 337
Seleccin de filas y columnas en las tablas pivote . . . . . . . . . . . . . . . . . . 338
Para seleccionar una fila o una columna de una tabla pivote . . . . . . . . . . 338
Modificacin de los resultados de las tablas pivote . . . . . . . . . . . . . . . . . 339
Impresin de tablas pivote . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
Para imprimir las capas ocultas de una tabla pivote . . . . . . . . . . . . . . . . . 340
Control de las rupturas de tabla para tablas anchas y largas. . . . . . . . . . . 341
343
xiv
353
14 Frecuencias
15 Descriptivos
361
16 Explorar
367
xv
17 Tablas de contingencia
377
18 Resmenes de casos
387
19 Medias
393
20 Cubos OLAP
399
21 Pruebas T
407
xvi
419
22 ANOVA de un factor
429
24 Correlaciones bivariadas
447
xvii
25 Correlaciones parciales
451
26 Distancias
457
27 Regresin lineal
463
28 Estimacin curvilnea
479
xviii
29 Anlisis discriminante
487
30 Anlisis factorial
499
513
515
xix
525
533
35 Pruebas no paramtricas
543
xx
573
583
38 Anlisis de fiabilidad
599
39 Escalamiento multidimensional
605
xxi
40 Estadsticos de la razn
613
42 Curvas COR
631
43 Utilidades
635
xxii
44 Opciones
641
663
46 Unidad de produccin
671
xxiii
687
721
xxiv
Etiquetas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 729
Opciones de SGR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 731
Registro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 736
Exclusin de presentacin de resultados del Visor . . . . . . . . . . . . . . . . . . 737
Envo de resultados a archivos de datos de SPSS . . . . . . . . . . . . . . . . . . . 737
Estructura de tablas OXML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 747
Identificadores SGR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 751
Apndices
A Administrador de acceso a bases de datos
755
757
ndice
761
xxv
Captulo
Resumen
multidimensionales. Explore las tablas reorganizando las filas, las columnas y las
capas. Haga importantes descubrimientos que suelen quedar velados en los informes
convencionales. Compare fcilmente los grupos dividiendo la tabla de manera que
aparezca solamente un grupo cada vez.
Grficos de alta resolucin. Como funciones bsicas de SPSS se incluyen grficos de
sus datos para el anlisis. Puede crear fcilmente subconjuntos de datos, combinar
categoras, aadir, agregar, fusionar, segmentar y transponer archivos, entre muchas
otras posibilidades.
1
2
Captulo 1
un botn o exportar tablas y grficos en formato HTML para distribuirlos por Internet
o dentro de una Intranet.
Ayuda en pantalla. Los tutoriales le ofrecern una introduccin global ampliamente
detallada; los temas de la Ayuda sensible al contexto de los cuadros de dilogo
le guiarn a travs de la ejecucin de tareas especficas; las definiciones de las
ventanas emergentes para los resultados de las tablas pivote le explicarn los trminos
estadsticos y Estudios de casos le proporcionar ejemplos prcticos sobre cmo
utilizar los procedimientos estadsticos y cmo interpretar los resultados.
Lenguaje de comandos. Aunque la mayora de las tareas se pueden llevar a cabo
Lectura y escritura de archivos de datos con formato Stata. Podr leer los archivos
de datos de la versin Stata 48 y escribir archivos de datos de la versin Stata
58. Si desea obtener ms informacin, escriba Stata en la pestaa ndice del
sistema de ayuda.
3
Resumen
Definicin de etiquetas de valor descriptivas de hasta 120 bytes (el lmite anterior
era de 60 bytes).
Uso del nuevo subcomando SQL del comando SAVE TRANSLATE para aadir
columnas nuevas a las tablas de bases de datos, modificar atributos de las
columnas de la tabla de base de datos, unir tablas y realizar otras acciones
permitidas con instrucciones SQL vlidas.
Grficos
Uso de la nueva interfaz del generador de grficos (men Grficos) para crear
grficos a partir de grficos de la galera predefinidos o a partir de las partes
individuales que constituyen un grfico (por ejemplo, el sistema de coordenadas
y las barras).
4
Captulo 1
5
Resumen
Resultados
Los resultados de la tabla pivote se proporcionan ahora para Asignar rangos a los
casos (RANK), Reemplazar valores perdidos (RMV) y Crear series temporales
(CREATE) en el sistema Base; todos los procedimientos de la opcin Anlisis
conjunto; Anlisis loglineal: Seleccin de modelo (HILOGLINEAR) de la opcin
Modelos avanzados; y Anlisis probit (PROBIT), Estimacin ponderada (WLS) y
Mnimos cuadrados en dos fases (2SLS) de la opcin Modelos de regresin.
Las estructuras de tabla que precisaban de una gran cantidad de tiempo para su
creacin o podan quedarse sin memoria con la opcin Tablas personalizadas
(CTABLES) se crean ahora de forma rpida y eficaz.
Aspecto mejorado
6
Captulo 1
En versiones anteriores, las funciones ANY y RANGE slo devolvan un valor perdido
si el primer argumento daba como resultado un valor perdido. Para mantener la
coherencia con otras funciones y clculos, estas funciones tambin devolvern un
valor perdido si cualquiera de los argumentos restantes son valores perdidos del
sistema o valores perdidos definidos por el usuario y el valor del primer argumento no
coincide con ninguno de los otros argumentos no perdidos. As:
COMPUTE newvar=ANY(var1, var2, var3)
Regresin logstica
Las mejoras de la funcin de macros pueden provocar errores en las tareas que antes
se ejecutaban sin errores. Especialmente, en el caso de la sintaxis que se procesa con
reglas interactivas, si se produce una llamada de macro al final de un comando, y no
hay ningn terminador del comando (un punto o una lnea en blanco), el siguiente
comando que siga a la expansin de la macro se interpretar como una lnea de
continuacin en lugar de como un comando nuevo, como en:
DEFINE !macro1()
var1 var2 var3
!ENDDEFINE.
FREQUENCIES VARIABLES = !macro1
DESCRIPTIVES VARIABLES = !macro1.
7
Resumen
Ventanas
Existen diversos tipos de ventanas en SPSS:
Editor de datos. El Editor de datos muestra el contenido del archivo de datos. Puede
crear nuevos archivos de datos o modificar los existentes con el Editor de datos.
Si tiene ms de un archivo de datos abierto, habr una ventana Editor de datos
independiente para cada archivo.
Visor. Todas las tablas, los grficos y los resultados estadsticos se muestran en
el Visor. Puede editar los resultados y guardarlos para utilizarlos posteriormente.
La ventana del Visor se abre automticamente la primera vez que se ejecuta un
procedimiento que genera resultados.
Visor de borrador. Los resultados pueden mostrarse como texto simple (en lugar de
pivote pueden modificarse con el Editor de resultados de texto. Puede editar los
resultados y cambiar las caractersticas de las fuentes (tipo, estilo, color y tamao).
Editor de sintaxis. Puede pegar las selecciones del cuadro de dilogo en una ventana de
8
Captulo 1
Figura 1-1
Editor de datos y Visor
9
Resumen
punto de la ventana).
E Pulse en el botn Designar ventana de la barra de herramientas (la que tiene el icono
Nota: en cuanto a las ventanas Editor de datos, la ventana Editor de datos activa
determina el conjunto de datos que se utiliza en anlisis o clculos posteriores. No
hay ninguna ventana Editor de datos designada. Si desea obtener ms informacin,
consulte Tratamiento bsico de varias fuentes de datos en Captulo 6 en p. 120.
Mens
Muchas de las tareas que desea realizar en SPSS estn disponibles mediante las
selecciones de mens. Cada ventana de SPSS tiene su propia barra de mens con
selecciones de mens adecuadas para ese tipo de ventana.
Los mens Analizar y Grficos aparecen en todas las ventanas, lo cual permite
generar fcilmente nuevos resultados sin tener que cambiar de ventana.
Barra de estado
La barra de estado que aparece en la parte inferior de cada ventana de SPSS
proporciona la siguiente informacin:
Estado del comando. En cada procedimiento o comando que se ejecuta, un recuento de
casos indica el nmero de casos procesados hasta el momento. En los procedimientos
estadsticos que requieren procesamientos iterativos, se muestra el nmero de
iteraciones.
10
Captulo 1
Cuadros de dilogo
La mayora de las opciones de los mens acceden a un cuadro de dilogo cuando se
seleccionan. Los cuadros de dilogo se utilizan para seleccionar variables y opciones
para el anlisis.
Los cuadros de dilogo para los procedimientos estadsticos tienen normalmente
dos componentes bsicos:
Lista de variables de origen. Una lista de variables en el conjunto de datos activo. En la
lista de origen slo aparecen los tipos de variables que el procedimiento seleccionado
permite. La utilizacin de variables de cadena corta y de cadena larga est restringida
en muchos procedimientos.
Listas de variables de destino. Una o varias listas que indican las variables elegidas
para el anlisis; un ejemplo son las listas de variables dependientes e independientes.
11
Resumen
Para los datos importados de orgenes de bases de datos, se utilizan los nombres
de los campos como etiquetas de variable.
Si las etiquetas son largas, site el puntero sobre la etiqueta de la lista para verla
completa.
Figura 1-2
Etiquetas de variable mostradas en un cuadro de dilogo
12
Captulo 1
Pegar. Genera la sintaxis de comandos a partir de las selecciones del cuadro de dilogo
dilogo desde la ltima vez que se abri y lo cierra. Durante una sesin se mantienen
las selecciones del cuadro de dilogo. El cuadro de dilogo retiene el ltimo conjunto
de especificaciones hasta que se anulan.
Ayuda. Proporciona ayuda contextual. Este control le lleva a una ventana de Ayuda
con informacin sobre el cuadro de dilogo actual. Tambin puede obtener ayuda
sobre los controles individuales del cuadro de dilogo pulsando en el control con el
botn derecho del ratn.
Subcuadros de dilogo
Puesto que la mayora de los procedimientos ofrecen un gran nmero de posibilidades,
un solo cuadro de dilogo no puede contener todas las opciones disponibles. El
cuadro de dilogo principal suele contener la informacin mnima que se requiere
para ejecutar un procedimiento. Las especificaciones adicionales se realizan en los
subcuadros de dilogo.
En el cuadro de dilogo principal, los controles con puntos suspensivos (...)
despus del nombre indican que se mostrar un subcuadro de dilogo.
Seleccin de variables
Para seleccionar una sola variable, basta con resaltarla en la lista de variables de
origen y pulsar en el botn de flecha derecha situado junto a la lista de variables de
destino. Si slo existe una lista de variables de destino, puede pulsar dos veces en las
variables individuales para desplazarlas desde la lista de origen hasta la de destino.
13
Resumen
Tipo de datos
Numrico
Escala
Cadena
Fecha
Tiempo
n/a
Ordinal
Nominal
14
Captulo 1
Figura 1-3
Informacin sobre la variable
guardado, leer una hoja de clculo, una base de datos o un archivo de datos de texto, o
introducir los datos directamente en el Editor de datos.
Seleccionar un procedimiento. Seleccione un procedimiento de los mens para
calcular estadsticos o crear un grfico.
Seleccionar las variables para el anlisis. Las variables del archivo de datos se
muestran en un cuadro de dilogo para el procedimiento.
Ejecute el procedimiento y observe los resultados. Los resultados se muestran en el
Visor.
15
Resumen
Asesor estadstico
Si no est familiarizado con SPSS o con los procedimientos estadsticos que ofrece,
el asesor estadstico (Statistics Coach) puede ayudarle solicitndole informacin
mediante preguntas simples, utilizando un lenguaje no tcnico y ejemplos visuales
que le ayudarn a seleccionar las funciones bsicas de los estadsticos y los grficos
ms apropiados para sus datos.
Para utilizar el Asesor estadstico, elija en los mens de cualquier ventana de SPSS:
?
Asesor estadstico
Captulo
Obtencin de ayuda
Temas. Proporciona acceso a las pestaas Contenido, ndice y Buscar, que pueden
Tutorial. Instrucciones ilustradas paso a paso sobre cmo utilizar muchas de las
del procedimiento que desea utilizar. Tras realizar una serie de selecciones, el
Asesor estadstico abre el cuadro de dilogo para el procedimiento estadstico,
de generacin de informes o de creacin de grficos que cumple los criterios
seleccionados. El Asesor estadstico proporciona acceso a la mayora de los
procedimientos estadsticos y de generacin de informes en el sistema Base y en
los procedimientos de creacin de grficos.
17
18
Captulo 2
Ayuda en el men contextual de una tabla pivote. Pulse con el botn derecho del
Estudios de casos. Pulse con el botn derecho del ratn en una tabla pivote y
19
Obtencin de ayuda
Otros recursos
20
Captulo 2
Sitio Web del servicio tcnico. Se pueden encontrar respuestas a muchos problemas
el contenido.
E Pulse en un elemento para ir a ese tema de la Ayuda.
Figura 2-1
Pestaa Contenido de la ventana de ayuda
21
Obtencin de ayuda
22
Captulo 2
Figura 2-3
Pestaa Bsqueda de la Ayuda
Los temas con un nombre de comando entre parntesis indican que el tema de la
Ayuda es para la sintaxis de comandos. Los temas que no incluyen el nombre de
comando entre parntesis suelen ser temas de ayuda para los cuadros de dilogo y
otros temas de interfaz grfica de usuario.
23
Obtencin de ayuda
Aparecer una ventana emergente con una descripcin del control y de cmo
utilizarlo. Tambin se puede acceder a la informacin general sobre el cuadro de
dilogo mediante el botn Ayuda que contiene.
Figura 2-4
Ayuda sobre el control del cuadro de dilogo con el botn derecho del ratn
24
Captulo 2
Figura 2-5
Ayuda de glosario de la tabla pivote activada con el botn derecho del ratn
Captulo
Archivos de datos
Los archivos de datos pueden tener formatos muy diversos, y este programa se ha
sido diseado para trabajar con muchos de ellos, incluyendo:
26
Captulo 3
E Pulse en Abrir.
Si lo desea, puede:
Leer los nombres de las variables de la primera fila en las hojas de clculo y en
los archivos delimitados por tabuladores.
Especificar el rango de casillas que desee leer en los archivos de hojas de clculo.
Especificar una hoja dentro de un archivo de Excel que desee leer (Excel 5 o
versiones posteriores).
o dBASE II. Cada caso es un registro. Las etiquetas de valor y de variable y las
especificaciones de valores perdidos se pierden si se guarda un archivo en este
formato.
Nombre de archivo largo de SAS. Versiones 79 de SAS para Windows, extensin larga.
Nombre de archivo corto de SAS. Versiones 79 de SAS para Windows, extensin corta.
SAS v6 para Windows. Versin 6.08 de SAS para Windows y OS2.
SAS v6 para UNIX. Versin 6 de SAS para UNIX (Sun, HP, IBM).
Transporte de SAS. Archivo de transporte de SAS.
27
Archivos de datos
varias hojas de trabajo. El Editor de datos lee por defecto la primera hoja. Para leer
una diferente, seleccione la que desee en la lista desplegable.
Rango. En los archivos de hoja de clculo, tambin puede leer un rango de casillas.
Para especificar rangos de casillas utilice el mismo mtodo que emplear en la
aplicacin de hoja de clculo.
cada variable est determinado por el tipo de datos y el ancho en el archivo de Excel.
Si la columna contiene ms de un tipo de datos (por ejemplo, fecha y numrico), el
tipo de datos se define como cadena y todos los valores se leen como valores de
cadena vlidos.
Casillas en blanco. En las variables numricas, las casillas en blanco se convierten en
el valor perdido del sistema indicado por un punto (o una coma). En las variables de
cadena, los espacios en blanco son valores de cadena vlidos y las casillas en blanco
se tratan como valores de cadena vlidos.
Nombres de variable. Si lee la primera fila del archivo de Excel (o la primera fila
del rango especificado) como nombres de variable, los valores que no cumplan las
normas de denominacin de variables se convertirn en nombres de variables vlidos
y los nombres originales se utilizarn como etiquetas de variable. Si no lee nombres
de variable del archivo de Excel, se asignarn nombres de variable por defecto.
28
Captulo 3
el valor perdido del sistema indicado por un punto (o una coma). En las variables de
cadena, los espacios en blanco son valores de cadena vlidos y las casillas en blanco
se tratan como valores de cadena vlidos.
Nombres de variable. Si no se leen los nombres de variable de la hoja de clculo, se
utilizan las letras de las columnas (A, B, C, ...) como nombres de variable de los
archivos de Excel y de Lotus. Para los archivos de SYLK y de Excel guardados en el
formato de presentacin R1C1, el programa utiliza para los nombres de variable el
nmero de la columna precedido por la letra C (C1, C2, C3, ...).
29
Archivos de datos
de variable de SPSS.
30
Captulo 3
E Seleccione la fuente de datos.
E Si es necesario (segn la fuente de datos), seleccione el archivo de base de datos y/o
Aada un mensaje solicitando al usuario que introduzca datos para crear una
consulta con parmetros.
Para leer archivos de bases de datos con una consulta ODBC guardada
E Elija en los mens:
Archivo
Abrir base de datos
Ejecutar consulta...
E Seleccione el archivo de consulta (*.spq) que desee ejecutar.
E Si es necesario (segn el archivo de base de datos), introduzca un nombre de acceso
y una contrasea.
E Si la consulta tiene una solicitud incrustada, introduzca otra informacin necesaria
31
Archivos de datos
Si no tiene configurada ninguna fuente de datos ODBC o si desea aadir una nueva,
pulse en Aadir fuente de datos ODBC. En el anlisis en modo distribuido (disponible
con SPSS Server), este botn no est disponible. Para aadir fuentes de datos en el
anlisis en modo distribuido, consulte con el administrador del sistema.
Una fuente de datos ODBC est compuesta por dos partes esenciales de
informacin: el controlador que se utilizar para acceder a los datos y la ubicacin
de la base de datos a la que se desea acceder. Para especificar las fuentes de datos
debern estar instalados los controladores adecuados. Para el anlisis en modo local
se pueden instalar los controladores desde el CD-ROM de este producto.
Data Access Pack de SPSS. Instala los controladores de una variedad de formatos
Data Access Pack de Microsoft. Instala los controladores para productos Microsoft,
incluido Microsoft Access. Para instalar el Data Access Pack de Microsoft, pulse
dos veces sobre Microsoft Data Access Pack en la carpeta Microsoft Data Access
Pack del CD-ROM.
32
Captulo 3
Figura 3-1
Cuadro de dilogo Asistente para bases de datos
Para acceder a las fuentes de datos OLE DB, debe tener los siguientes elementos
instalados en el ordenador que ejecuta SPSS:
.NET framework
Las versiones de estos componentes compatibles con esta versin de SPSS se pueden
instalar desde el CD de instalacin de SPSS y estn disponibles en el men de
reproduccin automtica.
33
Archivos de datos
Slo puede aadir fuentes de datos OLE DB en el anlisis en modo local. Para
aadir fuentes de datos OLE DB en el anlisis en modo distribuido en un servidor
Windows, consulte con el administrador del sistema.
Figura 3-2
Asistente para bases de datos con acceso a fuentes de datos OLE DB
34
Captulo 3
E Pulse en Siguiente o en la pestaa Conexin.
E Seleccione la base de datos introduciendo la ubicacin del directorio y el nombre de
base de datos o pulsando en el botn para desplazarse hasta una base de datos. (Puede
que tambin sean necesarios un nombre de usuario y una contrasea.)
E Pulse en Aceptar una vez que haya escrito toda la informacin necesaria. (Puede
E Pulse en Aceptar.
Volver a la primera pantalla del Asistente para bases de datos, donde puede
seleccionar el nombre guardado de la lista de fuentes de datos OLE DB y continuar
con el siguiente paso del asistente.
35
Archivos de datos
Figura 3-4
Cuadro de dilogo de acceso
36
Captulo 3
Figura 3-5
Cuadro de dilogo Seleccionar datos
Presentacin de los nombres de los campos. Para ver los campos de la tabla, pulse en el
signo ms (+) situado a la izquierda del nombre de una tabla. Para ocultar los campos
pulse en el signo menos () situado a la izquierda del nombre de una tabla.
Para aadir un campo. Pulse dos veces en cualquier campo de la lista Tablas
disponibles o arrstrelo hasta la lista Recuperar los campos en este orden. Los campos
se pueden volver a ordenar arrastrndolos y colocndolos dentro de la lista de campos.
Para eliminar un campo. Pulse dos veces en cualquier campo de la lista Recuperar los
37
Archivos de datos
Nota: para fuentes de datos OLE DB, slo puede seleccionar campos de una sola
tabla. Las uniones entre varias tablas no es compatible con fuentes de datos OLE DB.
38
Captulo 3
Unir tablas automticamente. Intenta unir las tablas automticamente en funcin de las
claves primarias/externas o de los nombres de campo y tipos de datos coincidentes.
Especificacin de tipos de uniones. Si el controlador permite uniones exteriores, podr
Propiedades de la relacin
Este cuadro de dilogo permite especificar el tipo de relacin que une las tablas.
Figura 3-7
Cuadro de dilogo Propiedades de la relacin
Uniones interiores. Una unin interior incluye slo las filas donde los campos
relacionados son iguales. En este ejemplo, se incluirn todas las filas con los mismos
valores de ID en las dos tablas.
Uniones exteriores. Adems de las coincidencias de uno a uno con uniones interiores,
tambin puede utilizar uniones exteriores para fusionar tablas con un esquema de
coincidencia de uno a varios. Por ejemplo, puede hacer una coincidencia con una
tabla donde slo hay algunos registros que representan los valores de datos y las
etiquetas descriptivas asociadas, con valores en una tabla que contiene cientos o miles
de registros que representan los encuestados. Una unin exterior izquierda incluye
todos los registros de la tabla izquierda y slo aquellos registros de la tabla derecha
en los que los campos relacionados son iguales. En una unin exterior derecha, se
39
Archivos de datos
importan todos los registros de la tabla derecha y slo aquellos registros de la tabla
izquierda en los que los campos relacionados son iguales.
La mayora de los criterios utiliza al menos uno de los seis operadores de relacin
(<, >, <=, >=, = y <>).
40
Captulo 3
Figura 3-8
Cuadro de dilogo Limitar la recuperacin de casos
Para crear sus criterios necesita por lo menos dos expresiones y una relacin para
conectarlas.
E Para crear una expresin, seleccione uno de los siguientes mtodos:
E Para elegir el operador relacional (como = o >), site el cursor en la casilla Relacin y
41
Archivos de datos
http://msdn.microsoft.com/library/en-us/odbc/htm/odbcscalar_functions.asp
Utilizar muestreo aleatorio. Esta opcin selecciona una muestra aleatoria de casos de la
fuente de datos. Para grandes fuentes de datos, es posible que desee limitar el nmero
de casos a una pequea y representativa muestra, lo que reduce considerablemente
el tiempo de ejecucin de procesos. Si el muestreo aleatorio original se encuentra
disponible para la fuente de datos, resulta ms rpido que el muestreo aleatorio de
SPSS dado que este ltimo an debe leer toda la fuente de datos para extraer una
muestra aleatoria.
42
Captulo 3
posible que desee ejecutar la misma consulta para ver las cifras de ventas de diversos
trimestres fiscales.
E Site el cursor en cualquier casilla de expresin y pulse en Pedir el valor al usuario
Para crear una solicitud, introduzca una cadena de peticin y un valor por defecto.
Esta cadena aparecer cada vez que un usuario ejecute la consulta. La cadena
especificar el tipo de informacin que debe introducir. Si la informacin no se ofrece
en una lista, la cadena sugerir el formato que debe aplicarse a la informacin. A
continuacin se muestra un ejemplo: Introduzca un trimestre (Q1, Q2, Q3, ...).
Permitir al usuario seleccionar el valor de la lista. Si selecciona esta casilla de
verificacin, puede limitar las elecciones del usuario a los valores que incluya en esta
lista. Asegrese de que los valores se separan por retornos de carro.
43
Archivos de datos
Adicin de Datos
Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con
el servidor SPSS), podr agregar los datos antes de leerlos en SPSS.
44
Captulo 3
Figura 3-11
Cuadro de dilogo Agregar datos
Tambin se pueden agregar los datos despus de leerlos en SPSS, pero si lo hace antes
ahorrar tiempo en el caso de grandes fuentes de datos.
E Para crear datos agregados, seleccione una o ms variables de segmentacin que
segmentacin.
Nota: Si utiliza el muestreo aleatorio, la agregacin no estar disponible.
45
Archivos de datos
Definicin de variables
Nombres y etiquetas de variables. El nombre completo del campo (columna) de la base
valores de las cadenas de anchura variable. Por defecto, la anchura es de 255 bytes y
slo se leen los primeros 255 bytes (generalmente 255 caracteres en idiomas de un
solo byte). El valor mximo que se puede asignar a este parmetro es de 32.767
bytes. Aunque posiblemente no desee truncar los valores de cadena, tampoco desear
especificar un valor innecesariamente alto, ya que producira que el procesamiento
de SPSS fuera ineficaz.
46
Captulo 3
Figura 3-12
Cuadro de dilogo Definir las variables
Ordenacin de casos
Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con
el servidor SPSS), podr ordenar los datos antes de leerlos en SPSS.
47
Archivos de datos
Figura 3-13
Cuadro de dilogo Ordenar casos
Tambin se pueden ordenar los datos despus de leerlos en SPSS, pero si lo hace antes
ahorrar tiempo en el caso de grandes fuentes de datos.
Resultados
El cuadro de dilogo Resultados muestra la instruccin Select de SQL para la consulta.
48
Captulo 3
Para pegar la sintaxis GET DATA completa en una ventana de sintaxis, seleccione
Pegarlo en el editor de sintaxis para su modificacin ulterior. Copiar y pegar la
instruccin Select de la ventana Resultados no pegar la sintaxis de comandos
necesaria.
49
Archivos de datos
50
Captulo 3
51
Archivos de datos
Este paso ofrece informacin sobre las variables. Una de las variables es similar a
uno de los campos de la base de datos. Por ejemplo, cada elemento de un cuestionario
es una variable.
Cmo estn organizadas sus variables? Para leer los datos adecuadamente, el
52
Captulo 3
separar variables. Las variables quedan registradas en el mismo orden para cada
caso, pero no necesariamente conservando la misma ubicacin para las columnas.
registro (lnea) para cada caso del archivo de datos. No se requiere delimitador
entre variables De hecho, en muchos archivos de datos de texto generados por
programas de ordenador, podra parecer que los valores de los datos se suceden,
sin espacios que los separen. La ubicacin de la columna determina qu variable
se est leyendo.
Estn incluidos los nombres de las variables en la parte superior del archivo? Si la
primera fila del archivo de datos contiene etiquetas descriptivas para cada variable,
podr utilizar dichas etiquetas como nombres de las variables. Los valores que no
cumplan las normas de denominacin de variables se convertirn en nombres de
variables vlidos.
53
Archivos de datos
Este paso ofrece informacin sobre los casos. Un caso es similar a un registro de una
base de datos. Por ejemplo, cada persona que responde a un cuestionario es un caso.
En qu nmero de lnea comienza el primer caso de datos? Indica la primera lnea
del archivo de datos que contiene valores de datos. Si la lnea o lneas superiores
del archivo de datos contienen etiquetas descriptivas o cualquier otro texto que no
represente valores de datos, dicha lnea o lneas no sern la lnea 1.
Cmo se representan sus casos? Controla la manera en que el Asistente para la
importacin de texto determina dnde finaliza cada caso y comienza el siguiente.
Cada lnea representa un caso. Cada lnea contiene un slo caso. Es bastante
comn que cada lnea (fila) contenga un slo caso, aunque dicha lnea puede ser
muy larga para un archivo de datos con un gran nmero de variables. Si no todas
las lneas contienen el mismo nmero de valores de datos, el nmero de variables
para cada caso quedar determinado por la lnea que tenga el mayor nmero de
54
Captulo 3
valores de datos. A los casos con menos valores de datos se les asignarn valores
perdidos para las variables adicionales.
los primeros n casos (siendo n un nmero especificado por el usuario) o una muestra
aleatoria a partir de un porcentaje especificado. Dado que esta rutina de muestreo
aleatorio toma una decisin pseudo-aleatoria para cada caso, el porcentaje de casos
seleccionados slo se puede aproximar al porcentaje especificado. Cuantos ms casos
contenga el archivo de datos, ms se acercar el porcentaje de casos seleccionados al
porcentaje especificado.
55
Archivos de datos
Este paso ofrece informacin sobre los casos. Un caso es similar a un registro de una
base de datos. Por ejemplo, cada encuestado es un caso.
En qu nmero de lnea comienza el primer caso de datos? Indica la primera lnea
del archivo de datos que contiene valores de datos. Si la lnea o lneas superiores
del archivo de datos contienen etiquetas descriptivas o cualquier otro texto que no
represente valores de datos, dicha lnea o lneas no sern la lnea 1.
Cuntas lneas representan un caso? Controla la manera en que el Asistente para la
56
Captulo 3
Cuntos casos desea importar? Puede importar todos los casos del archivo de datos,
los primeros n casos (siendo n un nmero especificado por el usuario) o una muestra
aleatoria a partir de un porcentaje especificado. Dado que esta rutina de muestreo
aleatorio toma una decisin pseudo-aleatoria para cada caso, el porcentaje de casos
seleccionados slo se puede aproximar al porcentaje especificado. Cuantos ms casos
contenga el archivo de datos, ms se acercar el porcentaje de casos seleccionados al
porcentaje especificado.
Este paso muestra la mejor opcin, segn el Asistente para la importacin de texto,
para leer el archivo de datos y le permite modificar la manera en que el asistente
leer las variables del archivo de datos.
57
Archivos de datos
smbolos que separan los valores de datos. Puede seleccionar cualquier combinacin
de espacios, comas, signos de punto y coma, tabulaciones o cualquier otro carcter.
En caso de existir varios delimitadores consecutivos sin valores de datos, dichos
delimitadores sern considerados valores perdidos.
Cul es el calificador de texto? Caracteres utilizados para encerrar valores que
contienen caracteres delimitadores. Por ejemplo, si una coma es el delimitador, los
valores que contengan comas se leern incorrectamente a menos que estos valores se
encierre en un calificador de texto, impidiendo que las comas del valor se interpreten
como delimitadores entre los valores. Los archivos de datos con formato CSV de
Excel utilizan las comillas dobles () como calificador de texto. El calificador de
texto aparece tanto al comienzo como al final del valor, encerrndolo completamente.
58
Captulo 3
Este paso muestra la mejor opcin, segn el Asistente para la importacin de texto,
para leer el archivo de datos y le permite modificar la manera en que el asistente leer
las variables del archivo de datos. Las lneas verticales de la ventana de vista previa
indican el lugar en el que en ese momento el Asistente para la importacin de texto
piensa que cada variable comienza en el archivo.
Inserte, mueva y elimine lneas de ruptura de variable segn convenga para separar
variables. Si para cada caso se utilizan varias lneas, seleccione cada lnea de la lista
desplegable y modifique las lneas de ruptura de variable segn convenga.
Notas:
En archivos de datos generados por ordenador que producen un flujo continuo de
valores de datos sin espacios ni otras caractersticas distintivas, puede resultar difcil
determinar el lugar en el que comienza cada variable. Los archivos de datos del
tipo citado anteriormente suelen depender de un archivo de definicin de datos u
otro tipo de descripcin escrita que especifique la ubicacin por lneas y columnas
de cada variable.
El Asistente para la importacin de texto est diseado para utilizarlo con una
fuente monoespaciada (de paso fijo) para mostrar el contenido del archivo. Con
fuentes no monoespaciadas (proporcionales), el contenido del archivo no se alinear
correctamente. Este valor de fuente se controla mediante el valor Fuentes de los
resultados de texto en la pestaa Visor del cuadro de dilogo Opciones (men Editar).
59
Archivos de datos
60
Captulo 3
o bien con la tecla CTRL presionada para seleccionar una serie de variables no
consecutivas.
importado.
Numrico. Los valores vlidos incluyen nmeros, los signos ms y menos iniciales
y un indicador decimal.
Cadena. Son valores vlidos prcticamente todos los caracteres del teclado y los
61
Archivos de datos
Este es el paso final del Asistente para la importacin de texto. Puede guardar sus
propias especificaciones en un archivo para hacer uso de ellas cuando importe archivos
de datos de texto similares. Tambin puede pegar la sintaxis generada por el Asistente
para la importacin de texto en una ventana de sintaxis. As podr personalizar y/o
guardar dicha sintaxis para utilizarla en futuras sesiones o en trabajos de produccin.
Cach local de los datos. Una cach de los datos es una copia completa del archivo de
datos, almacenada en un espacio temporal del disco. La cach del archivo de datos
puede mejorar el rendimiento.
62
Captulo 3
.NET framework
Las versiones de estos componentes compatibles con esta versin de SPSS se pueden
instalar desde el CD de instalacin de SPSS y estn disponibles en el men de
reproduccin automtica. Slo puede aadir orgenes de datos de Dimensions en el
anlisis en modo local. Esta caracterstica no est disponible en el anlisis en modo
distribuido con el servidor de SPSS.
Para leer datos de un origen de datos de Dimensions:
E En cualquiera de las ventanas de SPSS abiertas, elija en los mens:
Archivo
Abrir datos de dimensiones
E En la pestaa Propiedades de vnculo de datos: Conexin, especifique el archivo de
63
Archivos de datos
Tipo de datos de casos. El formato del archivo de datos de casos. Los formatos
disponibles incluyen:
Base de datos de Quanvert. Datos del caso en una base de datos de Quanvert.
Base de datos de Dimensions (MS SQL Server). Datos de casos en una base
de datos relacional de investigacin de mercado de SPSS en SQL Server. Esta
opcin se puede utilizar para leer los datos recopilados mediante mrInterview.
Ubicacin de datos de casos. El archivo que contiene los datos de casos. El formato de
este archivo debe ser coherente con el tipo de datos de casos seleccionado.
Figura 3-23
Propiedades de vnculo de datos: Pestaa Conexin
64
Captulo 3
las variables que indican el estado de encuesta (en curso, finalizada, fecha de
finalizacin, etc.). A continuacin, puede seleccionar cualquier variable de
sistema que desee incluir. Por defecto, se excluyen todas las variables del sistema.
65
Archivos de datos
Figura 3-24
Pestaa Importacin de datos de dimensiones: Seleccionar variables
Finalizada correctamente
Activa / en curso
66
Captulo 3
Tiempo agotado
Fecha de inicio. Se incluyen los casos para los que se complet la recopilacin
Si especifica tanto una fecha de inicio como una fecha de finalizacin, se definir
un rango de fechas de finalizacin desde la fecha de inicio hasta la fecha de
finalizacin (sta ltima no incluida).
67
Archivos de datos
Figura 3-25
Pestaa Importacin de datos de dimensiones: Seleccin de casos
68
Captulo 3
activarla).
E Elija en los mens:
Archivo
Guardar
La informacin acerca de las variables, como los valores perdidos y las etiquetas
de variable, no se incluye en los archivos de Excel exportados.
69
Archivos de datos
Al estar limitados los archivos de Excel a 256 columnas de datos, slo se incluirn
en el archivo exportado las primeras 256 variables.
Los archivos de Excel 4.0 y Excel 5.0/95 estn limitados a 16.384 registros o filas
de datos. Los archivos de Excel 972000 permiten 65.536 registros. Si los datos
superan estos lmites, aparecer un mensaje de aviso y los datos se truncarn de
acuerdo con el mximo tamao permitido por Excel.
Tipos de variables
La siguiente tabla muestra la relacin del tipo de las variables entre los datos
originales de SPSS y los datos exportados a Excel.
Tipo de variable de SPSS
Numrico
Coma
Dolar
$#,##0_); ...
Fecha
d-mmm-aaaa
Time
hh:mm:ss
Cadena
General
Los nombres de variable de SPSS que contienen caracteres de varios bytes (por
ejemplo, caracteres japoneses o chinos) se convierten en nombres de variable con
formato general Vnnn, donde nnn es un valor entero.
70
Captulo 3
SAS slo permite que exista un valor perdido del sistema, mientras que SPSS
permite que haya varios valores perdidos del sistema. Por tanto, todos los valores
perdidos del sistema en SPSS se asignan a un nico valor perdido del sistema
en el archivo SAS.
Existe la posibilidad de guardar los valores y las etiquetas de valor asociadas al archivo
de datos en un archivo de sintaxis de SAS. Por ejemplo, al exportar las etiquetas de
valor del archivo de datos coches.sav, el archivo de sintaxis generado contiene:
libname library 'd:\spss\' ;
proc format library = library ;
value ORIGIN /* Pas de origen */
1 = 'EE.UU.'
2 = 'Europa'
3 = 'Japn' ;
value CYLINDER /* Nmero de cilindros */
3 = '3 cilindros'
4 = '4 cilindros'
5 = '5 cilindros'
6 = '6 cilindros'
8 = '8 cilindros' ;
value FILTER__ /* cylrec = 1 | cylrec = 2 (FILTER) */
0 = 'No seleccionado'
1 = 'Seleccionado' ;
proc datasets library = library ;
modify cars;
format
ORIGIN ORIGIN.;
71
Archivos de datos
format
CYLINDER CYLINDER.;
format
FILTER__ FILTER__.;
quit;
La siguiente tabla muestra la relacin del tipo de las variables entre los datos
originales de SPSS y los datos exportados a SAS.
Tipo de variable de SPSS
Numrico
Numrico
12
Coma
Numrico
12
Puntos
Numrico
12
Notacin cientfica
Numrico
12
Fecha
Numrico
Fecha (Hora)
Numrico
Hora18
Dolar
Numrico
12
Moneda personalizada
Numrico
12
Cadena
Carcter
$8
Los archivos de datos que se guardan en formato Stata 5 se pueden leer con
Stata 4.
72
Captulo 3
Los nombres de variable de SPSS que contienen caracteres de varios bytes (por
ejemplo, caracteres japoneses o chinos) se convierten en nombres de variable con
formato general Vnnn, donde nnn es un valor entero.
Para las versiones 56 y las versiones Intercooled 78, se guardan los primeros 80
bytes de valores de cadena. Para Stata SE 78, se guardan los primeros 244 bytes
de valores de cadena.
Para las versiones 56 y las versiones Intercooled 78, slo se guardan los
primeros 2.047 bytes de valores de cadena. Para Stata SE 78, slo se guardan
las primeras 32.767 variables.
Numrico
Numrico
Coma
Numrico
Puntos
Numrico
Notacin cientfica
Numrico
Fecha, Momento_fecha
Numrico
D_m_Y
Tiempo, Tiempo_fecha
Numrico
g (nmero de segundos)
Dia_semana
Numrico
g (1-7)
Mes_ao
Numrico
Dlar
Numrico
g (1-12)
g
Moneda personalizada
Numrico
Cadena
Cadena
activarla).
73
Archivos de datos
E Elija en los mens:
Archivo
Guardar como...
E Seleccione un tipo de archivo de la lista desplegable.
E Introduzca un nombre de archivo para el nuevo archivo de datos.
datos como.
Los archivos de datos guardados con formato SPSS no se pueden leer en versiones
anteriores a la 7.5.
Al utilizar archivos de datos con nombres de variable con longitud superior a ocho
bytes en SPSS 10.X u 11.X, se utilizan versiones nicas de ocho bytes de los
nombres de variable, pero se mantienen los nombres originales de las variables
para su utilizacin en la versin 12.0 o posterior. En versiones anteriores a SPSS
74
Captulo 3
SPSS 7.0 (*.sav). Formato SPSS 7.0 para Windows. Los archivos de datos guardados
con formato SPSS 7.0 se pueden leer en SPSS 7.0 y en versiones anteriores de SPSS
para Windows, pero no incluyen los conjuntos de respuestas mltiples definidos ni la
informacin sobre la introduccin de datos para Windows.
SPSS/PC+ (*.sys). Formato SPSS/PC+. Si el archivo de datos contiene ms de 500
variables, slo se guardarn las 500 primeras. Para las variables con ms de un valor
definido como perdido por el usuario, los valores definidos como perdidos por el
usuario adicionales se recodificarn en el primero de estos valores.
SPSS porttil (*.por). El formato porttil de SPSS puede leerse en otras versiones
por tabuladores.
ASCII en formato fijo (*.dat). Archivos de texto ASCII con formato fijo, utilizando los
formatos de escritura por defecto para todas las variables. No existen tabuladores ni
espacios entre los campos de variable.
Excel 2.1(*.xls). Archivo de hoja de clculo de Microsoft Excel 2,1. El nmero
75
Archivos de datos
(DEC UNIX).
SAS v7+ Windows extensin corta (*.sd7). Versiones 78 de SAS para Windows con
76
Captulo 3
El cuadro de dilogo Guardar datos como: Variables permite seleccionar las variables
que desea guardar en el nuevo archivo de datos. Por defecto, se almacenarn todas las
variables. Anule la seleccin de las variables que no desea guardar o pulse en Eliminar
todo y, a continuacin, seleccione aquellas variables que desea guardar.
activarla).
E Elija en los mens:
Archivo
Guardar como...
E Seleccione los tipos de archivo.
E Pulse en Variables.
E Seleccione las variables que desee almacenar.
77
Archivos de datos
78
Captulo 3
Figura 3-27
Requisitos de espacio temporal en disco
Las acciones que crean una o ms columnas de datos en espacio temporal en disco son:
Las acciones que crean una copia completa del archivo de datos en espacio temporal
en disco son:
79
Archivos de datos
80
Captulo 3
leer los datos, la ejecucin de la consulta SQL se repite para cada procedimiento, lo
que puede significar un importante incremento en el tiempo de procesamiento si se
ejecuta un gran nmero de procedimientos.
Si se dispone de suficiente espacio en disco en el ordenador que realiza el anlisis
(el ordenador local o el servidor remoto), se pueden eliminar varias consultas SQL y
mejorar el tiempo de procesamiento mediante la creacin de una cach de datos del
archivo activo. La cach de datos es una copia temporal de todos los datos.
Nota: Por defecto, el Asistente para bases de datos crea de forma automtica una
cach de datos, pero si se utiliza el comando GET DATA en la sintaxis de comandos
para leer una base de datos, no se crear una cach de datos de forma automtica. En
la versin para estudiantes no est disponible la sintaxis de comandos.
ejemplo, la prxima vez que se ejecute un procedimiento estadstico), que ser lo que
normalmente se quiera porque no necesita una lectura adicional de los datos. Crear
cach ahora crea una cach de datos inmediatamente, lo cual no ser necesario la
mayora de las veces. Crear cach ahora se utiliza principalmente por dos razones:
Una fuente de datos est bloqueada y no se puede actualizar por nadie hasta
que finalice la sesin actual, abra una fuente de datos diferente o haga una cach
de los datos.
81
Archivos de datos
cambios realizados en el archivo de datos activo antes de crear una cach del archivo).
E En los mens de la ventana de sintaxis, elija:
Ejecutar
Todos
Nota: El ajuste de la cach no se almacena entre sesiones. Cada vez que se inicia una
nueva sesin, se toma el valor por defecto de la opcin que es 20.
Captulo
Tareas que requieren un gran consumo de memoria. Cualquier tarea que tarde
bastante tiempo en el anlisis en modo local ser una buena candidata para
el anlisis distribuido,
El anlisis distribuido slo afecta a las tareas relacionadas con los datos, como
lectura de datos, transformacin de datos, clculo de nuevas variables y clculo de
estadsticos. El anlisis distribuido no tiene ningn efecto sobre tareas relacionadas
con la edicin de resultados, como la manipulacin de tablas pivote o la modificacin
de grficos.
Nota: El anlisis distribuido est disponible slo si ambos equipos tienen una versin
local y acceso a una versin de servidor con licencia del software instalado en un
servidor remoto.
84
Captulo 4
en modo distribuido son comandos que realizan gran cantidad de clculos y generan
pocos resultados de salida (por ejemplo, tablas pivote pequeas y pocas, breves
resultados de texto, o pocos y sencillos grficos). El grado de mejora depende sobre
todo de la capacidad de clculo del servidor remoto.
Trabajos pequeos. Los trabajos que se ejecutan con rapidez en modo local, siempre
se ejecutarn ms lentamente en modo distribuido debido a la carga general inherente
al cliente /servidor.
Grficos. Los grficos orientados a los casos, como los diagramas de dispersin, los
grficos de residuos de regresin y los grficos de secuencia, necesitan que los datos
brutos se encuentren en el ordenador local. Para archivos de datos y tablas de bases
de datos grandes, este proceso puede repercutir en un descenso del rendimiento en
el modo distribuido debido a que los datos deben enviarse desde el servidor remoto
al ordenador local. Otros grficos se basan en datos resumidos o agregados y deben
realizarse de forma adecuada ya que la agregacin se lleva a cabo en el servidor.
Grficos interactivos. Si los datos brutos se guardan con los grficos interactivos (un
ajuste opcional), puede producir que se transfieran grandes cantidades de datos desde
el servidor remoto al ordenador local, incrementando de forma significativa el tiempo
que se tarda en guardar los resultados.
Tablas pivote. Las tablas pivote grandes pueden tardar ms en crearse en el modo
85
Anlisis en modo distribuido
Acceso al servidor
El cuadro de dilogo Acceso al servidor permite seleccionar el ordenador para
procesar comandos y ejecutar procedimientos. Puede seleccionar el ordenador local o
un servidor remoto.
Figura 4-1
Cuadro de dilogo Acceso al servidor
86
Captulo 4
Figura 4-2
Cuadro de dilogo Configuracin del acceso al servidor
Para obtener una lista de servidores disponibles, los nmeros de puerto para dichos
servidores y toda la informacin adicional necesaria para la conexin, pngase en
contacto con el administrador del sistema. No utilice el Nivel de socket seguro a
menos que lo indique el administrador.
Nombre del servidor. Un nombre de servidor puede ser un nombre alfanumrico
lista de servidores.
Conectar con Nivel de socket seguro. Las encriptaciones de Nivel de socket seguro
87
Anlisis en modo distribuido
desea utilizar.
E Introduzca el ID de usuario, nombre de dominio y contrasea suministrados por
el administrador.
Nota: De esta manera, se conectar de forma automtica al servidor por defecto en el
momento de iniciar la sesin.
Para cambiar a otro servidor:
E Seleccione el servidor de la lista.
E Introduzca el ID de usuario, nombre de dominio y contrasea (si es necesario).
Nota: Al cambiar de servidor durante una sesin, se cierran todas las ventanas
abiertas. Se solicitar guardar los cambios antes de que se cierren las ventanas.
Para aadir un servidor:
E Solicite al administrador la informacin de conexin del servidor.
E Pulse en Aadir para abrir el cuadro de dilogo Configuracin del acceso al servidor.
E Introduzca la informacin de conexin y la configuracin opcional y pulse en Aceptar.
88
Captulo 4
En el anlisis en modo distribuido, slo tendr acceso a los archivos del equipo
local si especifica la unidad como un dispositivo compartido y las carpetas que
contienen los archivos de datos como carpetas compartidas.
89
Anlisis en modo distribuido
o
Archivo
Abrir base de datos
o
Archivo
Leer datos de texto...
90
Captulo 4
91
Anlisis en modo distribuido
Figura 4-5
Vistas de los equipos local y remoto
En el anlisis en modo distribuido, slo tendr acceso a los archivos de datos del
equipo local si especifica la unidad como un dispositivo compartido y las carpetas
que contienen los archivos de datos como carpetas compartidas. Si el servidor est
ejecutando un sistema operativo diferente (por ejemplo, usted dispone de Windows
y el servidor se ejecuta bajo UNIX), probablemente no dispondr de acceso a los
archivos de datos locales en el anlisis en modo distribuido, aunque los archivos
estn en carpetas compartidas.
El anlisis en modo distribuido no es lo mismo que acceder a archivos de datos que
se encuentran en otro ordenador de la red. Se puede acceder a archivos de datos en
otros dispositivos de red tanto en anlisis en modo local como en anlisis en modo
distribuido. En modo local, se accede a otros dispositivos desde el ordenador local.
En el modo distribuido, se accede a otros dispositivos de red desde el servidor remoto.
92
Captulo 4
93
Anlisis en modo distribuido
Si utiliza la versin de servidor de SPSS para Windows NT, puede usar las
especificaciones de la UNC (convencin de denominacin universal) al acceder a
los archivos de datos mediante la sintaxis de comandos. El formato general de una
especificacin UNC es:
\\nombre_servidor\nombre_compartido\ruta\nombre_archivo
Si el ordenador no tiene un nombre asignado, puede utilizar su direccin IP, como en:
GET FILE = '\\204.125.125.53\public\julio\ventas.sav'.
Incluso con especificaciones de ruta de acceso UNC, slo se puede acceder a archivos
de datos que estn en carpetas y dispositivos compartidos. Cuando se utiliza anlisis
en modo distribuido, esta situacin incluye archivos de datos del ordenador local.
Servidores UNIX. En las plataformas UNIX, no hay un equivalente a las rutas UNC y
todas las rutas de acceso de los directorios deben ser rutas absolutas que comienzan
en la raz del servidor; las rutas relativas no estn permitidas. Por ejemplo, si el
archivo de datos est ubicado en /bin/spss/datos y el directorio actual tambin
es /bin/spss/datos, la sintaxis GET FILE='ventas.sav' no es vlida; se debe
especificar la ruta completa, como en:
GET FILE='/bin/spss/datos/ventas.sav'.
Captulo
Editor de datos
El Editor de datos proporciona un mtodo prctico (al estilo de las hojas de clculo)
para la creacin y edicin de archivos de datos. La ventana Editor de datos se abre
automticamente cuando se inicia una sesin.
El Editor de datos proporciona dos vistas de los datos.
Vista de datos. Esta vista muestra los valores de datos reales o las etiquetas de
valor definidas.
que incluye las etiquetas de la variable definida y de valor, tipo de dato (por
ejemplo, cadena, fecha y numrico), nivel de medida (nominal, ordinal o de
escala) y los valores perdidos definidos por el usuario.
En ambas vistas, se puede aadir, modificar y eliminar la informacin contenida
en el archivo de datos.
95
96
Captulo 5
Vista de datos
Figura 5-1
Vista de datos
Muchas de las funciones de la Vista de datos son similares a las que se encuentran en
aplicaciones de hojas de clculo. Sin embargo, existen varias diferencias importantes:
Las filas son casos. Cada fila representa un caso o una observacin. Por ejemplo,
cada individuo que responde a un cuestionario es un caso.
Las columnas son variables. Cada columna representa una variable o una
caracterstica que se mide. Por ejemplo, cada elemento en un cuestionario es
una variable.
Las casillas contienen valores. Cada casilla contiene un valor nico de una
variable para cada caso. La casilla se encuentra en la interseccin del caso y
la variable. Las casillas slo contienen valores de datos. A diferencia de los
programas de hoja de clculo, las casillas del Editor de datos no pueden contener
frmulas.
97
Editor de datos
Vista de variables
Figura 5-2
Vista de variables
Nombre de variable
Tipo de datos
98
Captulo 5
Nmero de decimales
Ancho de columna
Nivel de medida
99
Editor de datos
Nombres de variable
Para los nombres de variable se aplican las siguientes normas:
El nombre debe comenzar por una letra. Los dems caracteres pueden ser letras,
dgitos, puntos o los smbolos @, #, _ o $.
Se debe evitar acabar los nombres de variable con subrayado (para evitar conflictos
con las variables creadas automticamente por algunos procedimientos).
Nominal. Una variable puede ser tratada como nominal cuando sus valores
100
Captulo 5
Ordinal. Una variable puede ser tratada como ordinal cuando sus valores
representan categoras con alguna ordenacin intrnseca. Por ejemplo los niveles
de satisfaccin con un servicio, que vayan desde muy insatisfecho hasta muy
satisfecho. Son ejemplos de variables ordinales: las puntuaciones de actitud que
representan el nivel de satisfaccin o confianza y las puntuaciones de evaluacin
de la preferencia.
Escala. Una variable puede ser tratada como de escala cuando sus valores
representan categoras ordenadas con una mtrica con significado, por lo que
son adecuadas las comparaciones de distancia entre valores. Son ejemplos de
variables de escala: la edad en aos y los ingresos en dlares.
Nota: Para variables de cadena ordinales, se asume que el orden alfabtico de los
valores de cadena indica el orden correcto de las categoras. Por ejemplo, en una
variable de cadena cuyos valores sean bajo, medio, alto, se interpreta el orden de las
categoras como alto, bajo, medio (orden que no es el correcto). Por norma general,
se puede indicar que es ms fiable utilizar cdigos numricos para representar datos
ordinales.
Para las nuevas variables creadas durante una sesin, los datos ledos de los formatos
de archivo externos y los archivos de datos SPSS creados antes de la versin 8, la
asignacin del nivel de medida por defecto se basa en las siguientes reglas:
Las variables numricas con menos de 24 valores nicos y las variables de cadena
se establecen en nominales.
101
Editor de datos
Tipo de variable
Tipo de variable especifica los tipos de datos de cada variable. Por defecto se asume
que todas las variables nuevas son numricas. Se puede utilizar Tipo de variable para
cambiar el tipo de datos. El contenido del cuadro de dilogo Tipo de variable depende
del tipo de datos seleccionado. Para algunos tipos de datos, hay cuadros de texto para
la anchura y el nmero de decimales; para otros tipos de datos, simplemente puede
seleccionar un formato de una lista desplegable de ejemplos.
Figura 5-3
Cuadro de dilogo Tipo de variable
cada tres posiciones y con la coma como delimitador decimal. El Editor de datos
acepta valores numricos para este tipo de variables con o sin puntos, o bien en
notacin cientfica. Los valores no pueden contener puntos a la derecha del indicador
decimal.
Notacin cientfica. Una variable numrica cuyos valores se muestran con una E
intercalada y un exponente con signo que representa una potencia de base diez. El
Editor de datos acepta para estas variables valores numricos con o sin el exponente.
102
Captulo 5
El exponente puede aparecer precedido por una E o una D con un signo opcional, o
bien slo por el signo (por ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2 y 1,23+2).
Fecha. Una variable numrica cuyos valores se muestran en uno de los diferentes
formatos de fecha-calendario u hora-reloj. Seleccione un formato de la lista. Puede
introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas o
espacios. El rango de siglo para los valores de ao de dos dgitos est determinado
por la configuracin de las opciones (en el men Edicin, seleccione Opciones y, a
continuacin, pulse en la pestaa Datos).
Dlar. Una variable numrica que se muestra con un signo dlar inicial ($), comas
que delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden
introducir valores de datos con o sin el signo dlar inicial.
Moneda personalizada. Una variable numrica cuyos valores se muestran en uno de
en los clculos. Los valores pueden contener cualquier carcter siempre que no
se exceda la longitud definida. Las maysculas y las minsculas se consideran
diferentes. Este tipo tambin se conoce como variable alfanumrica.
103
Editor de datos
Para las variables de cadena, todos los valores se rellenan por la derecha hasta el
ancho mximo. Para una variable de cadena con un ancho de tres, un valor de No
se almacena internamente como 'No ' y no es equivalente a ' No'.
Para formatos de hora, se pueden utilizar dos puntos, puntos o espacios como
separadores entre horas, minutos y segundos. Las horas se muestran separadas
por dos puntos. Internamente, las horas se almacenan como el nmero de
segundos transcurridos desde el 14 de octubre de 1582.
Etiquetas de variable
Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud
(128 caracteres en los idiomas de doble byte). Las etiquetas de variable pueden
contener espacios y caracteres reservados que no se admiten en los nombres de
variable.
104
Captulo 5
Etiquetas de valor
Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este
proceso es especialmente til si el archivo de datos utiliza cdigos numricos para
representar categoras que no son numricas (por ejemplo, cdigos 1 y 2 para hombre
y mujer).
Las etiquetas de valor no estn disponibles para las variables de cadena larga
(variables de cadena de ms de 8 caracteres).
Figura 5-4
Cuadro de dilogo Etiquetas de valor
105
Editor de datos
E Para cada valor, escriba el valor y una etiqueta.
E Pulse en Aadir para introducir la etiqueta de valor.
E Pulse en Aceptar.
Valores perdidos
Valores perdidos define los valores de los datos definidos como perdidos por el
usuario. Por ejemplo, es posible que quiera distinguir los datos perdidos porque
un encuestado se niegue a responder de los datos perdidos porque la pregunta no
afecta a dicho encuestado. Los valores de datos que se especifican como perdidos
por el usuario aparecen marcados para un tratamiento especial y se excluyen de la
mayora de los clculos.
106
Captulo 5
Figura 5-5
Cuadro de dilogo Valores perdidos
Valores perdidos para las variables de cadena. Se considera que son vlidos todos
los valores de cadena, incluidos los valores vacos o nulos, a no ser que se definan
explcitamente como perdidos. Para definir como perdidos los valores nulos o vacos
de una variable de cadena, escriba un espacio en blanco en uno de los campos debajo
de la seleccin Valores perdidos discretos.
Se considera que son vlidos todos los valores de cadena, incluidos los valores vacos
o nulos, a no ser que se definan explcitamente como perdidos. Para definir como
perdidos los valores nulos o vacos de una variable de cadena, escriba un espacio en
blanco en uno de los campos debajo de la seleccin Valores perdidos discretos.
107
Editor de datos
Ancho de columna
Se puede especificar un nmero de caracteres para el ancho de la columna. Los
anchos de columna tambin se pueden cambiar en la Vista de datos pulsando y
arrastrando los bordes de las columnas.
Los formatos de columna afectan slo a la presentacin de valores en el Editor
de datos. Al cambiar el ancho de columna no se cambia el ancho definido de una
variable. Si el ancho real y definido de un valor es ms ancho que la columna,
aparecern asteriscos (*) en la ventana Vista de datos.
Alineacin de la variable
La alineacin controla la presentacin de los valores de los datos y/o de las etiquetas
de valor en la Vista de datos. La alineacin por defecto es a la derecha para las
variables numricas y a la izquierda para las variables de cadena. Este ajuste slo
afecta a la presentacin en la Vista de datos.
Crear varias variables nuevas con todos los atributos de una variable copiada.
variables.
108
Captulo 5
E Elija en los mens:
Edicin
Copiar
E Seleccione la casilla de atributos a la que quiere aplicar el atributo. (Puede seleccionar
Si pega el atributo en filas vacas, se crean nuevas variables con atributos por defecto
para todos los atributos excepto para el seleccionado.
Para aplicar todos los atributos de una variable definida:
E En la Vista de variables, seleccione el nmero de fila para la variable con los atributos
atributos que quiere utilizar para la nueva variable. (Se resaltar la fila entera.)
E Elija en los mens:
Edicin
Copiar
E Pulse en el nmero de la fila vaca situada bajo la ltima variable definida en el
archivo de datos.
109
Editor de datos
E Elija en los mens:
Edicin
Pegar variables...
E En el cuadro de dilogo Pegar variables, escriba el nmero de variables que desea
crear.
E Introduzca un prefijo y un nmero inicial para las nuevas variables.
E Pulse en Aceptar.
Introduccin de datos
En la Vista de datos, puede introducir datos directamente en el Editor de datos. Se
puede introducir datos en cualquier orden. Asimismo, se pueden introducir datos por
caso o por variable, para reas seleccionadas o para casillas individuales.
Los valores de datos no se registran hasta que se pulsa Intro o se selecciona otra
casilla.
Para introducir datos distintos de los numricos, en primer lugar, se debe definir
el tipo de variable.
110
Captulo 5
Figura 5-6
Conjunto de datos activo en la Vista de datos
111
Editor de datos
Edicin de datos
Con el Editor de datos es posible modificar los valores de datos de la Vista de datos
de muchas maneras. Tiene la posibilidad de:
112
Captulo 5
casillas.)
E Edite el valor directamente en la casilla o en el editor de casillas.
E Pulse Intro (o desplcese a otra casilla) para registrar el valor nuevo.
Mover o copiar los valores de una nica variable (columna) en varias variables.
113
Editor de datos
horas si el valor representa un nmero de segundos que puede producir una fecha u
hora vlidos. Para las fechas, los valores numricos menores que 86.400 se convierten
al valor perdido del sistema.
Se inserta una fila nueva para el caso y todas las variables reciben el valor perdido del
sistema.
114
Captulo 5
Se insertar una nueva variable con el valor perdido del sistema para todos los casos.
variable sobre la columna de variables a la derecha del lugar donde desea colocar la
variable, o en la Vista de variables, arrastre la variable a la fila de variables debajo de
donde desee colocarla.
115
Editor de datos
Ir a caso
El cuadro de dilogo Ir a caso permite ir al nmero de caso (fila) especificado en
el Editor de datos.
Figura 5-7
Cuadro de dilogo Ir a caso
para el caso.
116
Captulo 5
de cuadrcula.
Etiquetas de valor. Esta opcin activa y desactiva la presentacin de los valores reales
de los datos y las etiquetas de valor descriptivas definidas por el usuario. Esta opcin
slo est disponible en la Vista de datos.
Uso de varias vistas
En la Vista de datos, puede crear varias vistas (paneles) mediante los divisores
situados sobre la barra de desplazamiento horizontal y a la derecha de la barra de
desplazamiento vertical.
117
Editor de datos
Figura 5-9
Divisores de paneles de Vista de datos
Tambin puede utilizar el men Ventana para insertar y eliminar divisores de paneles.
Para insertar divisores:
E En la Vista de datos, elija en los mens:
Ventana
Dividir
118
Captulo 5
Utilice el men Ver en la ventana Editor de datos para mostrar u ocultar las lneas de
cuadrcula y para que se muestren o no los valores de los datos y las etiquetas de valor.
Captulo
A partir de SPSS 14.0, SPSS puede tener varias fuentes de datos abiertas al mismo
tiempo, lo que facilita:
Fundir varias fuentes de datos con diferentes formatos de datos (por ejemplo,
hojas de clculo, bases de datos, datos en texto) sin tener que guardar antes cada
fuente de datos en el formato de SPSS.
119
120
Captulo 6
Cada fuente de datos que se abra aparecer en una nueva ventana del Editor de datos.
Todas las fuentes de datos que haya abierto anteriormente permanecern abiertas
y estarn disponibles para su uso.
Para cambiar el conjunto de datos activo basta con pulsar en cualquier parte de
la ventana del Editor de datos de la fuente de datos que desee utilizar o bien
seleccionar la ventana del Editor de datos correspondiente a dicha fuente de
datos en el men Ventana.
121
Trabajo con varias fuentes de datos
Slo ser posible analizar las variables del conjunto de datos activo.
Figura 6-2
Lista de variables con las variables del conjunto de datos activo
Al menos una ventana del Editor de datos debe estar abierta durante una
sesin. Al cerrar la ltima ventana abierta del Editor de datos, SPSS se cierra
automticamente, preguntndole antes si desea guardar los cambios.
Nota: Si utiliza la sintaxis de comandos con las fuentes de datos abiertas (por ejemplo,
GET FILE, GET DATA), deber indicar explcitamente el nombre de cada conjunto
de datos para poder tener ms de una fuente de datos abierta al mismo tiempo.
122
Captulo 6
Captulo
Preparacin de datos
Asignar propiedades de las variables que describan los datos y determinen cmo
se deben tratar ciertos valores.
Identificar los casos que pueden contener informacin duplicada y excluir dichos
casos de los anlisis o eliminarlos del archivo de datos.
Crear nuevas variables con algunas categoras distintas que representen rangos de
valores de variables que tengan un mayor nmero de valores posibles.
Propiedades de variables
Los datos introducidos en la Vista de datos del Editor de datos o ledos en SPSS desde
un formato de archivos externo (como una hoja de clculo de Excel o un archivo
de datos de texto) carecen de ciertas propiedades de variables que pueden resultar
muy tiles, como:
123
124
Captulo 7
con formato SPSS como plantilla para definir las propiedades de variables y
archivos en el archivo de datos actual. Esto es particularmente til si utiliza
frecuentemente archivos de datos con un formato externo que tenga un contenido
similar, como puedan ser informes mensuales en formato Excel.
Explora los datos reales y enumera todos valores de datos nicos para cada
variable seleccionada.
Nota: Para utilizar Definir propiedades de variables sin explorar primero los casos,
introduzca 0 para el nmero de casos que se van a explorar.
125
Preparacin de datos
Figura 7-1
Cuadro de dilogo inicial para seleccionar las variables que se van a definir
E Seleccione las variables numricas o de cadena corta para las que desea crear etiquetas
de valor o definir o cambiar otras propiedades de las variables, como los valores
perdidos o las etiquetas de variable descriptivas.
Nota: Las variables de cadena largas (variables de cadena con una anchura definida
de ms de ocho caracteres) no se visualizan en la lista de variables. Las variables de
cadena largas no pueden tener etiquetas de valor definidas ni categoras de valores
perdidos.
E Especificar el nmero de casos que se van a explorar para generar la lista de valores
nicos. resulta especialmente til para los archivos de datos con mayor nmero de
casos, para el cual una exploracin del archivo de datos completo podra tardar una
gran cantidad de tiempo.
E Especifique un lmite superior para el nmero de valores nicos que se va a visualizar.
Esto es especialmente til para evitar que se generen listas de cientos, miles o incluso
millones de valores para las variables de escala (intervalo continuo, razn).
126
Captulo 7
E Pulse en Continuar para abrir el cuadro de dilogo Definir propiedades de variables
principal.
E Seleccione una variable para la que desee crear etiquetas de valor o definir o cambiar
dichos valores, puede introducirlos en la columna Valores por debajo del ltimo
valor explorado.
E Repita este proceso para cada variable de la lista para la que desee crear etiquetas
de valor.
E Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las variables.
127
Preparacin de datos
exploradas.
Tambin puede ordenarla por nombre de variable o nivel de medida pulsando en el
encabezado de columna correspondiente debajo de la Lista de variables exploradas.
Rejilla etiqueta valores
Etiqueta. Muestra las etiquetas de valor que ya se han definido. Puede aadir o
Valor. Valores nicos para cada variable seleccionada. Esta lista de valores nicos
Recuento. Nmero de veces que aparece cada valor en los casos explorados.
128
Captulo 7
Para las variables numricas, puede cambiar el tipo numrico (como numrico,
fecha, dlar o moneda personalizada), el ancho (nmero mximo de dgitos,
incluyendo los indicadores decimales y/o de agrupacin) y el nmero de
posiciones decimales.
129
Preparacin de datos
Aparece un perodo (.) si los valores explorados o los valores mostrados para
etiquetas de valor definidas ya existentes o categoras de valores perdidos no
son vlidos para el tipo de formato de presentacin seleccionado. Por ejemplo,
un valor numrico interno inferior a 86.400 no es vlido para una variable de
formato de fecha.
130
Captulo 7
mantener el mismo.
131
Preparacin de datos
E Seleccione una nica variable desde la que va a copiar las etiquetas de valor y otras
Las etiquetas de valor y las categoras de valores perdidos para los valores que
no se han definido an para las variables de destino se aaden al conjunto de
etiquetas de valor y categoras de valores perdidos para las variables de destino.
132
Captulo 7
puede tener hasta 63 bytes. De forma automtica, se aade un signo dlar al comienzo
del nombre del conjunto.
E Escriba una etiqueta descriptiva para el conjunto. (Esto es opcional.)
133
Preparacin de datos
E Pulse Aadir para aadir el conjunto de respuestas mltiples a la lista de conjuntos
definidos.
Dicotomas
Con ello se muestran las variables y las opciones utilizadas para definir este conjunto
de respuestas mltiples.
La lista Variables del conjunto, muestra las cinco variables utilizadas para
construir el conjunto de respuestas mltiples.
El grupo Las variables estn codificadas como indica que las variables son
dicotmicas.
El valor contado es 1.
E Seleccione (pulse en) una de las variables de la lista Variables del conjunto.
E Pulse con el botn derecho del ratn en la variable y seleccione Informacin sobre la
variable en el men contextual emergente.
E En la ventana Informacin sobre la variable, pulse en la flecha de la lista desplegable
134
Captulo 7
Figura 7-6
Informacin de las variables para una variable origen de dicotomas mltiples
Las etiquetas de valor indican que la variable es una dicotoma con valores de 0 y
1, que representan No y S, respectivamente. Las cinco variables de la lista estn
codificadas de la misma manera y el valor de 1 (el cdigo para S) es el valor contado
para el conjunto de dicotomas mltiples.
Categoras
135
Preparacin de datos
Etiquetas de valores contados. Utiliza las etiquetas de valor definidas de los valores
variable del conjunto con una etiqueta de variable definida como la etiqueta de
conjunto. Si ninguna de las variables del conjunto tiene etiquetas de variable
definidas, el nombre de la primera variable del conjunto se utiliza como la
etiqueta de conjunto.
Para copiar un archivo de datos externo como archivo de datos de origen, deber
tratarse de un archivo de datos con formato SPSS.
136
Captulo 7
Para utilizar el conjunto de datos activo como archivo de datos de origen, deber
contener al menos una variable. No podr utilizar un conjunto de datos activo que
est completamente en blanco como archivo de datos de origen.
137
Preparacin de datos
Figura 7-7
Asistente para la copia de propiedades de datos: Paso 1
E Seleccione el archivo de datos que contenga las propiedades de archivo y/o variable
que desee copiar. Puede ser un conjunto de datos abierto actualmente, un archivo de
datos con formato SPSS externo o el conjunto de datos activo.
E Siga las instrucciones detalladas del Asistente para la copia de propiedades de datos.
138
Captulo 7
Figura 7-8
Asistente para la copia de propiedades de datos: Paso 2
Actualiza la lista de origen para que muestre todas las variables del archivo
de datos de origen. Si se seleccionan variables de origen que no existen en el
conjunto de datos activo (basndose en el nombre de variable), se crearn nuevas
139
Preparacin de datos
140
Captulo 7
Figura 7-9
Asistente para la copia de propiedades de datos: Paso 3
Etiquetas de valor. Las etiquetas de valor son etiquetas descriptivas asociadas a valores
Fundir funde las etiquetas de valor definidas en la variable de origen con cualquier
141
Preparacin de datos
Fundir funde los atributos definidos de la variable de origen con cualquier atributo
procedimientos que diferencian entre los distintos niveles de medida, tanto el nivel
nominal como el ordinal se consideran categricos.
Formatos. Controla el tipo numrico (como numrico, fecha o moneda), el ancho
142
Captulo 7
Figura 7-10
Asistente para la copia de propiedades de datos: Paso 4
143
Preparacin de datos
datos activo y los reemplaza por los incluidos en el archivo de datos de origen.
Fundir aade los conjuntos de respuestas mltiples del archivo de datos de origen
Se ignorarn los conjuntos del archivo de datos de origen que contengan variables
no existentes en el conjunto de datos activo, a menos que se creen estas variables
basndose en las especificaciones del paso 2 (Seleccin de las variables de origen
y de destino) del Asistente para la copia de propiedades de datos.
datos activo y los reemplaza por los incluidos en el archivo de datos de origen.
144
Captulo 7
Fundir combina los del archivo de datos de los conjuntos de datos de origen y
activo. Los nombres de atributos exclusivos del archivo de origen que no existan
en el conjunto de datos activo se aadirn al conjunto de datos activo. En caso
de que exista un atributo con el mismo nombre en ambos archivos de datos,
el atributo con nombre existente en el conjunto de datos activo permanecer
inalterado.
Especificacin de ponderacin. Pondera los casos por la variable de ponderacin
actual del archivo de datos de origen, siempre que exista una variable coincidente en
el conjunto de datos activo. Sobrescribe cualquier ponderacin activada actualmente
en el conjunto de datos activo.
Etiqueta de archivo. Etiqueta descriptiva que se aplica a un archivo de datos mediante
el comando FILE LABEL.
145
Preparacin de datos
Resultados
Figura 7-11
Asistente para la copia de propiedades de datos: Paso 5
146
Captulo 7
Casos mltiples que representan el mismo caso pero con valores diferentes para
variables que no sean las que identifican el caso, como en el caso de varias
compras realizadas por la misma persona o empresa de diferentes productos o en
diferentes momentos.
Si lo desea, puede:
E Seleccionar una o varias variables para ordenar los casos dentro de los bloques
147
Preparacin de datos
Figura 7-12
Cuadro de dilogo Identificar casos duplicados
Definir casos coincidentes por. Los casos se consideran duplicados si sus valores
por las variables que definen los casos coincidentes. Puede seleccionar otras variables
de ordenacin que determinarn el orden secuencial de los casos en cada bloque de
coincidencia.
148
Captulo 7
Utilice los botones de flecha hacia arriba y hacia abajo que hay a la derecha de la
lista para cambiar el orden de las variables.
Variable indicador de casos primarios. Crea una variable con un valor de 1 para todos
los casos nicos y para el caso identificado como caso primario en cada bloque de
casos coincidentes y un valor de 0 para los duplicados no primarios de cada bloque.
Puede utilizar la variable indicador como una variable de filtro para excluir los
duplicados que no sean primarios de los informes y los anlisis sin eliminar
dichos casos del archivo de datos.
Recuento secuencial de casos coincidentes en cada bloque. Crea una variable con un
valor secuencial de 1 a n para los casos de cada bloque de coincidencia. La secuencia
se basa en el orden actual de los casos de cada bloque, que puede ser el orden del
archivo original o el orden determinado por las variables de ordenacin especificadas.
Mover los casos coincidentes a la parte superior del archivo. Ordena el archivo de datos
de manera que todos los bloques de casos coincidentes estn en la parte superior
del archivo de datos, facilitando la inspeccin visual de los casos coincidentes en
el Editor de datos.
Mostrar tabla de frecuencias de las variables creadas. Las tablas de frecuencias
contienen los recuentos de cada valor de las variables creadas. Por ejemplo, para la
variable de indicador de caso primario, la tabla mostrara tanto el nmero de casos
con un valor de 0 en esa variable, que indica el nmero de duplicados, como el
149
Preparacin de datos
nmero de casos con un valor de 1 para esa variable, que indica el nmero de casos
nicos y primarios.
Valores perdidos. En el caso de variables numricas, los valores perdidos del sistema
se tratan como cualquier otro valor: los casos que tengan el valor perdido del sistema
para una variable de identificacin se tratarn como si tuviesen valores coincidentes
para dicha variable. En el caso de variables de cadena, los casos que no tengan
ningn valor para una variable de identificacin se tratarn como si tuviesen valores
coincidentes para dicha variable.
Categorizador visual
El Categorizador visual est concebido para ayudarle en el proceso de creacin de
variables nuevas, basado en la agrupacin de los valores contiguos de las variables
existentes para dar lugar a un nmero limitado de categoras diferentes. Puede utilizar
el Categorizador visual para:
150
Captulo 7
Figura 7-13
Cuadro de dilogo inicial para seleccionar las variables que se van a categorizar
Como alternativa, puede limitar la cantidad de casos que se van a explorar. Con
los archivos de datos que contengan un gran nmero de casos, la limitacin del
nmero de casos que se va a explorar puede ahorrar tiempo, pero debe evitarse este
procedimiento en lo posible, ya que influir en la distribucin de los valores que sern
utilizados en los clculos posteriores en el Categorizador visual.
Nota: Las variables de cadena y las variables numricas nominales no se muestran en
la lista de variables origen. El Categorizador visual requiere que las variables sean
numricas, medidas bien a nivel ordinal o de escala, puesto que asume que los valores
de los datos representan algn tipo de orden lgico que puede ser utilizado para
agrupar los valores con sentido. Puede cambiar el nivel de medida de una variable en
la Vista de variables del Editor de datos. Si desea obtener ms informacin, consulte
Nivel de medida de variable en Captulo 5 en p. 99.
151
Preparacin de datos
152
Captulo 7
Categorizacin de variables
Figura 7-14
Categorizador visual, cuadro de dilogo principal
sin valores perdidos definidos por el usuario o del sistema para la variable
seleccionada, se usan en la generacin de la distribucin de valores que emplea
el Categorizador visual, incluyendo el histograma que se visualiza en el cuadro
de dilogo principal y los puntos de corte basados en percentiles o unidades de
desviacin tpica.
153
Preparacin de datos
Valores perdidos. Indica el nmero de casos explorados con valores perdidos definidos
por el usuario y perdidos del sistema. Los valores perdidos no se incluyen en ninguno
de los intervalos de categorizacin. Si desea obtener ms informacin, consulte
Valores perdidos definidos por el usuario en el Categorizador visual en p. 159.
Variable actual. El nombre y etiqueta de variable (si existe) de la variable actualmente
categorizada.
Etiqueta. Puede introducir una etiqueta de variable descriptiva con una longitud
Puede pulsar y arrastrar las lneas de los puntos de corte a distintos puntos del
histograma, modificando as la amplitud de los intervalos.
Puede eliminar categoras arrastrando las lneas de los puntos de corte fuera del
histograma.
154
Captulo 7
Valor. Valores que definen los puntos de corte superiores en cada intervalo. Puede
introducir los valores o utilizar Crear puntos de corte para crear automticamente
los intervalos basndose en los criterios seleccionados. Por defecto, se incluye
automticamente un punto de corte con el valor SUPERIOR. Este intervalo
contendr cualesquiera valores no perdidos por encima de los restantes puntos de
corte. El intervalo definido por el punto de corte inferior incluir todos los valores
no perdidos que sean menores que o iguales a dicho valor (o, sencillamente,
inferiores a ese valor, dependiendo de la forma en que haya definido los puntos
de corte superiores).
categorizada. Puesto que los valores de la nueva variable slo sern nmeros
enteros en secuencia, del 1 a n, las etiquetas que describan lo que representan los
valores pueden resultar muy tiles. Puede introducir las etiquetas o usar Crear
etiquetas para crear las etiquetas de valor de forma automtica.
Para eliminar un intervalo de la rejilla
E Pulse con el botn derecho las casillas Valor o Etiqueta del intervalo.
E En el men contextual emergente, seleccione Eliminar fila.
Nota: Si elimina la categora SUPERIOR, los casos con valores superiores al valor
del ltimo punto de corte especificado recibirn el valor perdido del sistema en
la nueva variable.
Para eliminar todas las etiquetas o todas las categoras definidas
E Pulse en cualquier parte de la rejilla con el botn derecho del ratn.
E En el men contextual emergente, seleccione Eliminar todas las etiquetas o Eliminar
todos los puntos de corte.
155
Preparacin de datos
Incluidos (<=). Los casos con el valor especificado en la casilla Valor se incluyen
en el intervalo. Por ejemplo, si especifica los valores 25, 50 y 75, los casos con
el valor exacto 25 se incluirn en el primer intervalo, de esta forma se incluirn
todos los casos con valor menor o igual a 25.
Excluido (<). Los casos con el valor especificado en la casilla Valor no se incluyen
156
Captulo 7
E Seleccione los criterios de generacin de los puntos de corte que definirn los
intervalos.
E Pulse en Aplicar.
Figura 7-15
Cuadro de dilogo Crear puntos de corte
1120, 2130, etc.), basndose en dos (cualesquiera) de los tres criterios siguientes:
Posicin del primer punto de corte. Valor que define el lmite superior de la
categora inferior (por ejemplo, el valor 10 indica un intervalo que incluya todos
los valores hasta 10).
157
Preparacin de datos
Percentiles iguales basados en los casos explorados. Genera intervalos con un nmero
corte ms uno. Por ejemplo, tres puntos de corte generan cuatro categoras
percentiles (cuartiles), conteniendo cada una el 25% de los casos.
el nmero total de casos. Por ejemplo, el valor 33,3 generara tres categoras (dos
puntos de corte), conteniendo cada una el 33,3% de los casos.
Si la variable origen contiene un nmero relativamente pequeo de valores distintos, o
un gran nmero de casos con el mismo valor, es posible que obtenga menos categoras
que las solicitadas. En caso de haber varios valores idnticos en un punto de corte,
todos se incluyen en el mismo intervalo; por consiguiente, los porcentajes reales
pueden no ser siempre iguales.
Puntos de corte en media y desviaciones tpicas seleccionadas, basadas en casos
explorados. Genera categoras basndose en los valores de la media y la desviacin
En una distribucin normal, el 68% de los casos se encuentra dentro de una distancia
de una desviacin tpica respecto a la media, el 95% entre dos desviaciones tpicas
y el 99% dentro de tres desviaciones tpicas. La creacin de categoras basadas en
desviaciones tpicas puede ocasionar que algunas categoras queden definidas fuera
del rango real de los datos, e incluso fuera del rango de valores posibles de los datos
(por ejemplo, un rango de salarios negativos).
Nota: Los clculos de los percentiles y las desviaciones tpicas se basan en los
casos explorados. Si limita el nmero de casos explorados, puede que las categoras
resultantes no incluyan la proporcin de casos deseada en dichas categoras, sobre
todo si el archivo de datos se orden segn la variable origen. Por ejemplo, si limita
158
Captulo 7
la exploracin a los primeros 100 casos de un archivo de datos con 1000 casos y el
archivo de datos est ordenado en orden descendente por edad del encuestado, en lugar
de cuatro categoras percentiles de la edad, cada una con el 25% de los casos, podra
encontrarse con que las tres primeras categoras contuvieran cada una slo en torno al
3,3% de los casos, mientras que la ltima categora albergara el 90% de los casos.
Copia de categoras
Al crear categoras para una o ms variables, puede copiar las especificaciones de
categorizacin de otra variable a la seleccionada en ese momento, o desde la variable
seleccionada en ese momento a varias otras variables.
Figura 7-16
Copia de categoras en o desde la variable actual
definido intervalos.
E Pulse A otras variables.
159
Preparacin de datos
E Seleccione las variables para las que desea crear nuevas variables con los mismos
intervalos.
E Pulse Copiar.
o
E Seleccione (pulse) una variable de la Lista de variables exploradas sobre la cual desea
160
Captulo 7
usuario en la variable de origen tena definida una etiqueta de valor, dicha etiqueta se
mantendr como etiqueta de valor para el valor recodificado de la nueva variable.
Nota: Si la variable de origen tiene definido un rango de valores perdidos de usuario
con la forma MENOR-n, donde n es un nmero positivo, los valores perdidos definidos
por el usuario correspondientes a la nueva variable, sern nmeros negativos.
Captulo
En una situacin ideal, los datos brutos son perfectamente apropiados para el tipo de
anlisis que se desea realizar y cualquier relacin existente entre las variables o es
adecuadamente lineal o es claramente ortogonal. Desafortunadamente, esto ocurre
pocas veces. El anlisis preliminar puede revelar esquemas de codificacin poco
prcticos o errores de codificacin, o bien pueden requerirse transformaciones de los
datos para exponer la verdadera relacin existente entre las variables.
Puede realizar transformaciones de los datos de todo tipo, desde tareas sencillas,
como la agrupacin de categoras para su anlisis posterior, hasta otras ms
avanzadas, como la creacin de nuevas variables basadas en ecuaciones complejas
e instrucciones condicionales.
Clculo de variables
Utilice el cuadro de dilogo Calcular para calcular los valores de una variable
basndose en transformaciones numricas de otras variables.
Puede crear nuevas variables o bien reemplazar los valores de las variables
existentes. Para las nuevas variables, tambin se puede especificar el tipo y la
etiqueta de variable.
161
162
Captulo 8
Figura 8-1
Cuadro de dilogo Calcular variable
163
Transformaciones de los datos
slo a las funciones). El grupo de funciones con la etiqueta Todo contiene una
lista de todas las funciones y variables de sistema disponibles. En un rea
reservada del cuadro de dilogo se muestra una breve descripcin de la funcin
o variable actualmente seleccionada.
Si los valores contienen decimales, debe utilizarse una coma(,) como indicador
decimal.
Para las nuevas variables de cadena, tambin debern seleccionar Tipo y etiqueta
para especificar el tipo de datos.
164
Captulo 8
Funciones
Se dispone de muchos tipos de funciones, entre ellos:
Funciones aritmticas
Funciones estadsticas
Funciones de cadena
165
Transformaciones de los datos
Funciones de distribucin
Si desea obtener una lista completa de las funciones, busque funciones en el ndice del
sistema de Ayuda en pantalla.
El resultado es el valor perdido slo si el caso tiene valores perdidos para las tres
variables.
En las funciones estadsticas se puede especificar el nmero mnimo de argumentos
que deben tener valores no perdidos. Para ello, escriba un punto y el nmero mnimo
de argumentos despus del nombre de la funcin, como en:
MEAN.2(var1, var2, var3)
166
Captulo 8
167
Transformaciones de los datos
168
Captulo 8
E Pulse en Definir valores y especifique los valores que se deben contar.
Si lo desea, puede definir un subconjunto de casos en los que contar las apariciones
de valores.
169
Transformaciones de los datos
Figura 8-7
Cuadro de dilogo Contar apariciones: Si los casos
Si desea conocer las consideraciones generales sobre el uso del cuadro de dilogo Si
los casos, consulte Calcular variable: Si los casos en p. 163.
Recodificacin de valores
Los valores de datos se pueden modificar mediante la recodificacin. Esto es
particularmente til para agrupar o combinar categoras. Puede recodificar los valores
dentro de las variables existentes o crear variables nuevas que se basen en los valores
recodificados de las variables existentes.
170
Captulo 8
Figura 8-8
Cuadro de dilogo Recodif. en mismas var.
171
Transformaciones de los datos
incluyen sus puntos finales y los valores definidos como perdidos por el usuario que
estn dentro del rango.
Perdido por el sistema. Valores asignados por SPSS cuando los valores de sus datos
Perdido por el sistema o por el usuario. Observaciones que tienen valores que, o
bien han sido declarados como perdidos por el usuario o bien son desconocidos
y se les ha asignado el valor perdido del sistema, lo cual se indica mediante
un punto (.).
Todos los dems valores. Cualquier valor no incluido en una de las especificaciones
datos (numrico o de cadena) del valor introducido debe coincidir con el tipo de
datos del valor antiguo.
para recodificar la variable o las variables. Puede aadir, cambiar y borrar las
especificaciones que desee. La lista se ordena automticamente basndose en la
especificacin del valor antiguo y siguiendo este orden: valores nicos, valores
perdidos, rangos y todos los dems valores. Si cambia una especificacin de
172
Captulo 8
Si selecciona mltiples variables, todas deben ser del mismo tipo. No se pueden
recodificar juntas las variables numricas y de cadena.
173
Transformaciones de los datos
Figura 8-10
Cuadro de dilogo Recodif. en distintas var. (Recodificar en distintas variables)
174
Captulo 8
Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede
recodificar valores individuales, rangos de valores y valores perdidos. Los rangos y
los valores perdidos del sistema no se pueden seleccionar para las variables de cadena,
ya que ninguno de los conceptos es aplicable a estas variables. Los valores antiguos
deben ser del mismo tipo de datos (numricos o de cadena) que la variable original.
Los rangos incluyen sus puntos finales y los valores definidos como perdidos por
el usuario que estn dentro del rango.
Perdido por el sistema. Valores asignados por SPSS cuando los valores de sus datos
Perdido por el sistema o por el usuario. Observaciones que tienen valores que, o
bien han sido declarados como perdidos por el usuario o bien son desconocidos
y se les ha asignado el valor perdido del sistema, lo cual se indica mediante
un punto (.).
Todos los dems valores. Cualquier valor no incluido en una de las especificaciones
datos (numrico o de cadena) del valor introducido debe coincidir con el tipo de
datos del valor antiguo.
175
Transformaciones de los datos
Copiar los valores antiguos. Retiene el valor antiguo. Si algunos de los valores no
requieren la recodificacin, utilice esta opcin para incluir los valores antiguos.
Cualquier valor antiguo que no sea especificado no se incluye en la nueva
variable, y los casos con esos valores se asignan al valor perdido por el sistema en
la nueva variable.
Las variables de los resultados son cadenas. Define la nueva variable recodificada
para recodificar la variable o las variables. Puede aadir, cambiar y borrar las
especificaciones que desee. La lista se ordena automticamente basndose en la
especificacin del valor antiguo y siguiendo este orden: valores nicos, valores
perdidos, rangos y todos los dems valores. Si cambia una especificacin de
recodificacin en la lista, el procedimiento volver a ordenar la lista automticamente,
si fuera necesario, para mantener este orden.
176
Captulo 8
Figura 8-11
Cuadro de dilogo Valores antiguos y nuevos
177
Transformaciones de los datos
Figura 8-12
Cuadro de dilogo Asignar rangos a los casos
178
Captulo 8
Rango fraccional. El valor de la nueva variable es igual al rango dividido por la suma
de las ponderaciones de los casos no perdidos.
Rango fraccional como porcentaje. Cada rango se divide por el nmero de casos que
tienes valores vlidos y se multiplica por 100.
Suma de ponderaciones de los casos. El valor de la nueva variable es igual a la suma
de las ponderaciones de los casos. La nueva variable es una constante para todos los
casos del mismo grupo.
Ntiles. Los rangos se basan en los grupos percentiles, de forma que cada uno de
estimada.
Frmula de estimacin de la proporcin. Para estimaciones de la proporcin y
es el rango, que va de 1 a w.
179
Transformaciones de los datos
Figura 8-13
Cuadro de dilogo Asignar rangos a los casos: Tipos
La tabla siguiente muestra cmo los distintos mtodos asignan rangos a los valores
empatados.
Valor
Media
Menor
Mayor
Secuencial
10
15
15
15
16
20
180
Captulo 8
Recodificacin automtica
El cuadro de dilogo Recodificacin automtica le permite convertir los valores
numricos y de cadena en valores enteros consecutivos. Si los cdigos de la
categora no son secuenciales, las casillas vacas resultantes reducen el rendimiento e
incrementan los requisitos de memoria de muchos procedimientos. Adems, algunos
procedimientos no pueden utilizar variables de cadena y otros requieren valores
enteros consecutivos para los niveles de los factores.
Figura 8-15
Cuadro de dilogo Recodificacin automtica
Los valores de cadena se recodifican por orden alfabtico, con las maysculas
antes que las minsculas.
Los valores perdidos se recodifican como valores perdidos mayores que cualquier
valor no perdido y conservando el orden. Por ejemplo, si la variable original
posee 10 valores no perdidos, el valor perdido mnimo se recodificar como 11, y
el valor 11 ser un valor perdido para la nueva variable.
181
Transformaciones de los datos
Usar el mismo esquema de recodificacin para todas las variables. Esta opcin
Todas las variables deben ser del mismo tipo (numricas o de cadena).
Todos los valores observados para todas las variables seleccionadas se utilizan
para crear un orden de valores para recodificar en enteros consecutivos.
Los valores perdidos definidos por el usuario para las variables nuevas se basan
en la primera variable de la lista con valores perdidos definidos por el usuario.
El resto de los valores de las dems variables originales, excepto los valores
perdidos del sistema, se consideran vlidos.
Trate los valores de cadena en blanco como valores perdidos definidos por el usuario.
En el caso de las variables de cadena, los valores en blanco o nulos no son tratados
como valores perdidos del sistema. Esta opcin recodifica automticamente las
cadenas en blanco en un valor perdido definido por el usuario mayor que el valor
no perdido mximo.
Plantillas
182
Captulo 8
Todas las variables seleccionadas para la recodificacin deben ser del mismo tipo
(numricas o de cadena) y dicho tipo debe coincidir con el tipo definido en la
plantilla.
183
Transformaciones de los datos
184
Captulo 8
Figura 8-16
Pantalla principal del Asistente para fecha y hora
Aprender cmo se representan las fechas y las horas en SPSS. Esta opcin ofrece
Crear una variable de fecha/hora a partir de una cadena que contiene una fecha
o una hora. Use esta opcin para crear una variable de fecha/hora a partir de
una variable de cadena. Por ejemplo, dispone de una variable de cadena que
representa fechas con el formato mm/dd/aaaa y desea crear una variable de
fecha/hora a partir de ella.
185
Transformaciones de los datos
Calcular con fechas y horas. Use esta opcin para aadir o sustraer valores a
Extraer una parte de una variable de fecha/hora. Esta opcin permite extraer parte
dilogo Definir fechas, que se usa para crear variables de fecha/hora compuestas
por un conjunto de fechas secuenciales. Esta caracterstica se usa generalmente
para asociar fechas con datos de serie temporal.
Nota: las tareas se desactivan cuando el conjunto de datos carece de los tipos de
variables necesarios para completar la tarea. Por ejemplo, si el conjunto de datos no
contiene variables de cadena, la tarea de creacin de una variable de fecha/hora a
partir de una cadena no se aplica y se desactiva.
186
Captulo 8
Variables de duracin. Las variables de duracin tienen un formato que representa una
Fecha y hora actuales. La variable del sistema $TIME contiene la fecha y hora actuales.
Representa el nmero de segundos transcurridos desde el 14 de octubre de 1582 hasta
la fecha y la hora en que se ejecute el comando de transformacin que la use.
187
Transformaciones de los datos
de cadena representa las fechas. La lista Valores de ejemplo muestra los valores
reales de la variable seleccionada en el archivo de datos. Los valores de la variable
de cadena que no se ajusten al patrn seleccionado darn como resultado un valor
perdido del sistema para la nueva variable.
188
Captulo 8
189
Transformaciones de los datos
190
Captulo 8
vlido para los meses en SPSS es 113, todos los casos en que el valor del da
del mes pertenezca al rango 1431 se considerarn valores perdidos del sistema
para la nueva variable.
Si lo desea, puede:
191
Transformaciones de los datos
fecha y hora.
Seleccin del tipo de clculo que realizar con las variables de fecha/hora
Figura 8-21
Adicin o sustraccin de valores de variables de fecha/hora, paso 1
Aadir o sustraer una duracin a una fecha. Use esta opcin para aadir o sustraer
valores a una variable con formato de fecha. Si lo desea, puede aadir o sustraer
duraciones que sean valores fijos, como 10 das, o los valores de una variable
numrica (por ejemplo, una variable que represente aos).
192
Captulo 8
Calcular el nmero de unidades de tiempo entre dos fechas. Use esta opcin para
obtener la diferencia entre dos fechas medidas en una unidad seleccionada. Por
ejemplo, puede obtener el nmero de aos o el nmero de das que separan dos
fechas.
Sustraer dos duraciones. Use esta opcin para obtener la diferencia entre dos
193
Transformaciones de los datos
duracin. Las variables utilizadas para las duraciones no pueden ser variables de fecha
o de fecha/hora. Pueden ser variables de duracin o variables numricas simples.
E Seleccione la unidad que represente la duracin en la lista desplegable. Seleccione
Duracin si se usa una variable y sta tiene el formato de una duracin, como hh:mm
o hh:mm:ss.
194
Captulo 8
Asistente para fecha y hora denominada Realizar clculos con las fechas.
195
Transformaciones de los datos
196
Captulo 8
197
Transformaciones de los datos
198
Captulo 8
Si lo desea, puede:
199
Transformaciones de los datos
E Seleccione la variable que contiene la parte de fecha u hora que desee extraer.
E En la lista desplegable, seleccione la parte de la variable que se va a extraer. Si lo
200
Captulo 8
201
Transformaciones de los datos
Reemplazar valores definidos como perdidos por el usuario y perdidos del sistema
con estimaciones basadas en uno de los diversos mtodos existentes.
Definir fechas
El cuadro de dilogo Definir fechas genera variables de fecha que se pueden utilizar
para establecer la periodicidad de una serie temporal y para etiquetar los resultados
de los anlisis de series temporales.
Figura 8-30
Cuadro de dilogo Definir fechas
Los casos son. Define el intervalo de tiempo utilizado para generar las fechas.
202
Captulo 8
todas las variables con los nombres siguientes: ao_, trimestre_, mes_, semana_,
da_, hora_, minuto_, segundo_ y fecha_.
con la sintaxis de comandos (por ejemplo, una semana de cuatro das laborables).
Este elemento simplemente refleja el estado actual del conjunto de datos activo.
Su seleccin en la lista no produce ningn efecto.
El primer caso es. Define el valor de la fecha inicial, que se asigna al primer caso. A
los casos subsiguientes se les asignan valores secuenciales, basndose en el intervalo
de tiempo.
Periodicidad a nivel superior. Indica la variacin cclica repetitiva, como el nmero
de meses de un ao o el nmero de das de la semana. El valor mostrado indica el
valor mximo que se puede introducir.
Para cada componente utilizado para definir la fecha, se crea una nueva variable
numrica. Los nombres de las nuevas variables terminan con un carcter de
subrayado. A partir de los componentes tambin se crea una variable de cadena
descriptiva, fecha_. Por ejemplo, si selecciona Semanas, das, horas, se crearn cuatro
nuevas variables: semana_, da_, hora_ y fecha_.
Si ya se han definido variables de fecha, stas sern reemplazadas cuando se
definan nuevas variables de fecha con los mismos nombres que las existentes.
Para definir fechas para los datos de serie temporal
E Elija en los mens:
Datos
Definir fechas...
E Seleccione un intervalo de tiempo en la lista Los casos son.
E Introduzca el valor o los valores que definen la fecha inicial en El primer caso es, que
203
Transformaciones de los datos
datos de serie temporal; mientras que las variables con formato de fecha representan
fechas y horas mostradas en varios formatos de fecha y hora. Las variables de fecha
son nmeros enteros sencillos que representan el nmero de das, semanas, horas,
etc., a partir de un punto inicial especificado por el usuario. Internamente, la mayora
de las variables con formato de fecha se almacenan como el nmero de segundos
transcurridos desde el 14 de octubre de 1582.
204
Captulo 8
o variables originales.
E Seleccione la variable o variables a partir de las cuales desee crear nuevas variables de
Introducir nombres de variables, para omitir los nombres por defecto de las
nuevas variables.
205
Transformaciones de los datos
perdido del sistema al comienzo y al final de la serie para una amplitud de n es igual a
n/2 para los valores de la amplitud par y para los valores de la amplitud impar. Por
ejemplo, si la amplitud es 5, el nmero de casos con el valor perdido del sistema
al comienzo y al final de la serie es 2.
Media mvil anterior. Se utiliza el promedio de un rango de las observaciones
precedentes. La amplitud es el nmero de valores precedentes de la serie utilizados
para calcular el promedio. El nmero de casos con el valor perdido del sistema al
comienzo de la serie es igual al valor de la amplitud.
Medianas mviles. Se utiliza la mediana de un rango de los valores de la serie, que
206
Captulo 8
Si genera una serie nueva que contenga predicciones que sobrepasen el final
de la serie existente (al pulsar en el botn Guardar y realizar las selecciones
adecuadas), la serie original y la serie residual generada incluirn datos perdidos
para las observaciones nuevas.
Los valores perdidos al principio o fin de una serie no suponen un problema especial;
sencillamente acortan la longitud til de la serie. Las discontinuidades que aparecen
en mitad de una serie (datos incrustados perdidos) pueden ser un problema mucho ms
grave. El alcance del problema depende del procedimiento analtico que se utilice.
El cuadro de dilogo Reemplazar valores perdidos crea nuevas variables de series
temporales a partir de otras existentes, reemplazando los valores perdidos por
estimaciones calculadas mediante uno de los distintos mtodos posibles. Los nombres
por defecto de las nuevas variables se componen de los seis primeros caracteres de las
variables existentes utilizadas para crearlas, seguidos por un carcter de subrayado y
un nmero secuencial. Por ejemplo, para la variable precio, el nombre de la nueva
variable sera precio_1. Las nuevas variables conservaran cualquier etiqueta de
valor definida de las variables originales.
207
Transformaciones de los datos
Figura 8-32
Cuadro de dilogo Reemplazar los valores perdidos
Para reemplazar los valores perdidos para las variables de series temporales
E Elija en los mens:
Transformar
Reemplazar valores perdidos...
E Seleccione el mtodo de estimacin que desee utilizar para reemplazar los valores
perdidos.
E Seleccione la variable o variables para las que desea reemplazar los valores perdidos.
Si lo desea, puede:
Introducir nombres de variables, para omitir los nombres por defecto de las
nuevas variables.
208
Captulo 8
Mediana de puntos adyacentes. Sustituye los valores perdidos por la mediana de los
Se utilizan para la interpolacin el ltimo valor vlido antes del valor perdido y el
primer valor vlido despus del valor perdido. Si el primer o el ltimo caso de la serie
tiene un valor perdido, el valor perdido no se sustituye.
Tendencia lineal en el punto. Reemplaza los valores perdidos de la serie por la
tendencia lineal en ese punto. Se hace una regresin de la serie existente sobre una
variable ndice escalada de 1 a n. Los valores perdidos se sustituyen por sus valores
pronosticados.
209
Transformaciones de los datos
Facility, una versin ejecutable independiente de SPSS que se distribuye junto con
la versin de servidor de SPSS. Para obtener informacin acerca del uso de SPSS
Batch Facility, consulte el manual del usuario de SPSS Batch Facility (SPSS Batch
Facility Users Guide), que se incluye como archivo PDF en el CD del producto de la
versin de servidor de SPSS.
El proceso de puntuacin consta de:
E Cargar un modelo de un archivo en formato XML (PMML).
E Calcular las puntuaciones como una variable nueva, mediante las funciones
210
Captulo 8
E Escriba un nombre para asociarlo a este modelo. Cada modelo cargado debe tener un
nombre exclusivo.
E Pulse en Archivo y seleccione un archivo de modelo. El cuadro de dilogo Abrir
211
Transformaciones de los datos
Archivo. El archivo XML (PMML) que contiene las especificaciones del modelo.
Valores perdidos
Una variable predictora no contiene ningn valor. Para las variables numricas,
esto significa el valor perdido del sistema. Para las variables de cadena, esto
significa una cadena nula.
casos con valores perdidos. El mtodo para determinar el valor que sustituye a un
valor perdido depende del tipo de modelo predictivo.
Modelos de AnswerTree y modelos del comando SPSS TREE. Para los modelos
212
Captulo 8
logstica, si un valor medio del predictor se incluye como parte del modelo
guardado, este valor medio se utiliza en lugar del valor perdido en el clculo
de puntuacin y la puntuacin contina. Si el predictor es categrico (por
ejemplo, un factor en un modelo de regresin logstica) o si el valor medio no
est disponible, se devolver el valor perdido del sistema.
Usar perdido por el sistema. Devuelve el valor perdido por el sistema al puntuar un
Esto generar una tabla de asas de modelo. La tabla contiene una lista de todos los
modelos cargados e incluye el nombre (denominado asa de modelo) asignado al
modelo, el tipo de modelo, la ruta de acceso al archivo de modelo y el mtodo para
tratar los valores perdidos.
Figura 8-35
Lista de modelos cargados
213
Transformaciones de los datos
Captulo
Los archivos de datos no siempre estn organizados de la forma ideal para las
necesidades especficas del usuario. Puede que le interese combinar archivos de
datos, organizar los datos en un orden diferente, seleccionar un subconjunto de
casos o cambiar la unidad de anlisis agrupando casos. Entre la amplia gama de
posibilidades de transformacin de archivos disponibles se encuentran las siguientes:
Ordenar datos. Puede ordenar los casos en funcin del valor de una o ms variables.
Transponer casos y variables. El formato de archivo de datos de SPSS lee las filas
como casos y las columnas como variables. Para los archivos de datos en los que
el orden est invertido, se pueden intercambiar las filas y las columnas para leer
los datos en el formato correcto.
Fundir archivos. Puede fundir dos o ms archivos de datos. Es posible combinar
archivos con las mismas variables pero con casos distintos, o con los mismos casos
pero variables diferentes.
Seleccionar subconjuntos de casos. Puede restringir el anlisis a un subconjunto de
215
216
Captulo 9
Ordenar casos
Este cuadro de dilogo ordena los casos (las filas) del archivo de datos basndose en
los valores de una o ms variables de ordenacin. Puede ordenar los casos en orden
ascendente o descendente.
Para las variables de cadena, las letras maysculas preceden a las minsculas
correspondientes en orden. Por ejemplo, el valor de cadena S precede a s.
Figura 9-1
Cuadro de dilogo Ordenar casos
217
Gestin y transformacin de los archivos
Transponer
Transponer crea un archivo de datos nuevo en el que se transponen las filas y las
columnas del archivo de datos original de manera que los casos (las filas) se convierten
en variables, y las variables (las columnas) se convierten en casos. Tambin crea
automticamente nombres de variable y presenta una lista de dichos nombres.
Fundir el conjunto de datos activo con otro conjunto de datos abierto o archivo de
datos con formato SPSS que contenga las mismas variables pero diferentes casos.
Fundir el conjunto de datos activo con otro conjunto de datos abierto o archivo de
datos con formato SPSS que contenga los mismos casos pero diferentes variables.
218
Captulo 9
Aadir casos
Aadir casos fusiona el conjunto de datos activo con un segundo conjunto de datos o
un archivo de datos con formato SPSS que contenga las mismas variables (columnas)
pero diferentes casos (filas). Por ejemplo, podra registrar la misma informacin de
los clientes de dos zonas de venta diferentes y conservar los datos de cada zona en
archivos distintos. El segundo conjunto de datos puede ser un archivo de datos con
formato SPSS externo o un conjunto de datos disponible en la sesin actual.
219
Gestin y transformacin de los archivos
Figura 9-3
Cuadro de dilogo Aadir casos
Variables desemparejadas. Muestra las variables que se van a excluir del nuevo
archivo de datos fusionado. Las variables del conjunto de datos activo se identifican
mediante un asterisco (*). Las variables del otro conjunto de datos se identifican con
un signo ms (+). Por defecto, la lista contiene:
Variables del nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo
archivo de datos fusionado. Por defecto, la lista incluye todas las variables que
coinciden en el nombre y el tipo de datos (numricos o de cadena).
220
Captulo 9
Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de
origen. Esta variable toma un valor 0 para los casos del archivo de datos de trabajo y
un valor 1 para los casos del archivo de datos externo.
Para fundir archivos de datos con las mismas variables y casos diferentes
E Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios
conjuntos de datos abiertos, convierta uno de los conjuntos de datos que desea
fusionar en el conjunto de datos activo. Los casos de este archivo aparecern primero
en el nuevo archivo de datos fusionado.
E Elija en los mens:
Datos
Fundir archivos
Aadir casos...
E Seleccione el conjunto de datos o el archivo de datos con formato SPSS que va a
la misma informacin registrada con nombres diferentes en los dos archivos. Por
ejemplo, la fecha de nacimiento podra tener el nombre de variable fechnac en un
archivo y nacfech en el otro.
Para seleccionar una pareja de variables desemparejadas
E Pulse en una de las variables en la lista Variables desemparejadas.
E Mantenga pulsada la tecla Ctrl mientras selecciona la otra variable de la lista con el
ratn (pulse al mismo tiempo la tecla Ctrl y el botn izquierdo del ratn).
E Pulse en Casar para desplazar el par de variables a la lista Variables del nuevo
conjunto de datos activo. (El nombre de variable del conjunto de datos activo se
emplear como el nombre de variable en el archivo fusionado.)
221
Gestin y transformacin de los archivos
Figura 9-4
Seleccin de parejas de variables mediante la tecla Ctrl
Utilizar el nombre de variable del otro conjunto de datos en lugar del nombre del
conjunto de datos activo para las parejas de variables.
Incluir dos variables con el mismo nombre pero de diferentes tipos o longitudes
de cadena. Por ejemplo, para incluir la variable numrica sexo del conjunto de
datos activo y la variable de cadena sexo del otro conjunto de datos, primero se
debe cambiar el nombre de una de ellas.
222
Captulo 9
Aadir variables
Aadir variables fusiona el conjunto de datos activo con otro conjunto de datos
abierto o un archivo de datos con formato SPSS que contenga los mismos casos (filas)
pero diferentes variables (columnas). Por ejemplo, es posible que desee fusionar
un archivo de datos que contenga los resultados previos de la prueba con otro que
contenga los resultados posteriores.
Si se utilizan una o ms variables clave para emparejar los casos, los dos
conjuntos de datos deben estar ordenados por orden ascendente de la variable
o variables clave.
Los nombres de las variables del segundo archivo de datos que son duplicados de
los del conjunto de datos activo se excluyen por defecto, ya que Aadir variables
supone que estas variables contienen informacin duplicada.
223
Gestin y transformacin de los archivos
Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de
origen. Esta variable toma un valor 0 para los casos del archivo de datos de trabajo y
un valor 1 para los casos del archivo de datos externo.
Figura 9-5
Cuadro de dilogo Aadir variables
Variables excluidas. Muestra las variables que se van a excluir del nuevo archivo
de datos fusionado. Por defecto, la lista contiene los nombres de variable de otro
conjunto de datos que son duplicados de los del conjunto de datos. Las variables
del conjunto de datos activo se identifican mediante un asterisco (*). Las variables
del otro conjunto de datos se identifican con un signo ms (+). Si desea incluir en
el archivo fusionado una variable excluida con un nombre duplicado, cmbiele el
nombre y adala a la lista de variables que se van a incluir.
Nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo conjunto de
datos fusionado. Por defecto, se incluyen en la lista todos los nombres de variable
nicos que existan en ambos conjuntos de datos.
Variables clave. Si algunos casos de un conjunto de datos no se emparejan con los
del otro conjunto de datos (es decir, si faltan casos en un conjunto de datos), utilice
las variables clave para identificar y emparejar correctamente los casos de ambos
conjuntos de datos. Tambin puede utilizar las variables clave segn tablas de claves.
224
Captulo 9
Las variables clave deben tener los mismos nombres en ambos conjuntos de datos.
Los casos que no se emparejan con las variables clave se incluyen en el archivo
fusionado, pero no se funden con los casos del otro archivo. Los casos no
emparejados slo contienen valores para las variables del archivo de procedencia;
las variables del otro archivo contienen el valor perdido del sistema.
cada caso se pueden aplicar a varios casos del otro archivo de datos. Por ejemplo, si
un archivo contiene informacin sobre los diferentes miembros de la familia (como el
sexo, la edad, la formacin) y el otro contiene informacin global (como los ingresos
totales, el nmero de miembros o la ubicacin), se puede utilizar el archivo global
como una tabla de referencia y aplicar los datos comunes de la familia a cada uno de
sus miembros en el archivo fusionado.
Para fundir archivos con los mismos casos pero variables diferentes
E Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios
conjuntos de datos abiertos, convierta uno de los conjuntos de datos que desea
fusionar en el conjunto de datos activo.
E Elija en los mens:
Datos
Fundir archivos
Aadir variables...
E Seleccione el conjunto de datos o el archivo de datos con formato SPSS que va a
225
Gestin y transformacin de los archivos
Las variables clave deben existir en el conjunto de datos activo y en el otro conjunto
de datos. Ambos conjuntos de datos deben estar ordenados segn el orden ascendente
de las variables clave, y el orden de las variables de la lista Variables clave debe
ser igual a su secuencia de ordenacin.
Agregar datos
Agregar datos agrega grupos de casos en el conjunto de datos activo en casos
individuales y crea un archivo nuevo agregado o variables nuevas en el conjunto de
datos activo que contiene los datos agregados. Los casos se agregan en funcin del
valor de una o ms variables de segmentacin (agrupacin).
226
Captulo 9
Figura 9-6
Cuadro de dilogo Agregar datos
227
Gestin y transformacin de los archivos
Puede anular los nombres por defecto de las variables agregadas con nuevos nombres
de variable, proporcionar etiquetas de variable descriptivas y cambiar las funciones
empleadas para calcular los valores de los datos agregados. Tambin puede crear una
variable que contenga el nmero de casos en cada grupo de segmentacin.
Para agregar un archivo de datos
E Elija en los mens:
Datos
Agregar...
E Seleccione una o ms variables de segmentacin que definan cmo deben agruparse
Aadir las variables agregadas al archivo de datos de trabajo. Las nuevas variables
Crear un nuevo conjunto de datos que contenga nicamente las variables agregadas.
Escribir un nuevo archivo de datos que contenga slo las variables agregadas. Crea
un nuevo archivo de datos con los datos agregados. Por defecto, se guarda un
archivo denominado aggr.sav en el directorio actual.
228
Captulo 9
En el caso de los archivos de datos muy grandes, puede resultar ms eficiente agregar
datos ordenados previamente.
El archivo ya est ordenado por las variables de segmentacin. Si los datos ya han sido
ordenados por los valores de las variables de segmentacin, esta opcin permite
al procedimiento una ejecucin ms rpida y utilizar menos memoria. Utilice esta
opcin con precaucin.
de datos voluminosos, puede ser necesario ordenar el archivo de datos por los valores
de las variables de segmentacin antes de realizar la agregacin. No se recomienda
esta opcin a menos que se presenten problemas de memoria y/o rendimiento.
229
Gestin y transformacin de los archivos
Figura 9-7
Cuadro de dilogo Funcin de agregacin
230
Captulo 9
Segmentar archivo
Segmentar archivo divide el archivo de datos en distintos grupos para el anlisis
basndose en los valores de una o ms variables de agrupacin. Si selecciona varias
variables de agrupacin, los casos se agruparn por variable dentro de las categoras
de la variable anterior de la lista Grupos basados en. Por ejemplo, si selecciona sexo
como la primera variable de agrupacin y minora como la segunda, los casos se
agruparn por minoras dentro de cada categora de sexo.
Cada ocho caracteres de una variable de cadena larga (variables de cadena que
superan los ocho caracteres) cuenta como una variable hasta llegar al lmite de
ocho variables de agrupacin.
Los casos deben ordenarse segn los valores de las variables de agrupacin, en el
mismo orden en el que aparecen las variables en la lista Grupos basados en. Si
el archivo de datos todava no est ordenado, seleccione Ordenar archivo segn
variables de agrupacin.
Figura 9-9
Cuadro de dilogo Segmentar archivo
Comparar los grupos. Los grupos de segmentacin del archivo se presentan juntos para
poder compararlos. Para las tablas pivote se crea una sola tabla y cada variable de
segmentacin del archivo puede desplazarse entre las dimensiones de la tabla. En
231
Gestin y transformacin de los archivos
el caso de los grficos se crea un grfico diferente para cada grupo y se muestran
juntos en el Visor.
Organizar los resultados por grupos. Los resultados de cada procedimiento se muestran
Seleccionar casos
Seleccionar casos proporciona varios mtodos para seleccionar un subgrupo de casos
basndose en criterios que incluyen variables y expresiones complejas. Tambin se
puede seleccionar una muestra aleatoria de casos. Los criterios usados para definir un
subgrupo pueden incluir:
Expresiones aritmticas
Expresiones lgicas
Funciones
232
Captulo 9
Figura 9-10
Cuadro de dilogo Seleccionar casos
seleccionada del archivo de datos. Se seleccionan los casos con cualquier valor
distinto del 0 o del valor perdido para la variable seleccionada.
233
Gestin y transformacin de los archivos
Resultados
del conjunto de datos. Slo se pueden recuperar los casos eliminados saliendo
del archivo sin guardar ningn cambio y abrindolo de nuevo. La eliminacin
de los casos ser permanente si se guardan los cambios en el archivo de datos.
Nota: Si elimina los casos no seleccionados y guarda el archivo, no ser posible
recuperar estos casos.
Para seleccionar un subconjunto de casos
E Elija en los mens:
Datos
Seleccionar casos...
E Seleccione uno de los mtodos de seleccin de casos.
E Especifique los criterios para la seleccin de casos.
234
Captulo 9
Figura 9-11
Cuadro de dilogo Seleccionar casos: Si
235
Gestin y transformacin de los archivos
Figura 9-12
Cuadro de dilogo Seleccionar casos: Muestra aleatoria
casos indicado. Dado que esta rutina toma una decisin pseudo-aleatoria para cada
caso, el porcentaje de casos seleccionados slo se puede aproximar al especificado.
Cuantos ms casos contenga el archivo de datos, ms se acercar el porcentaje de
casos seleccionados al porcentaje especificado.
Exactamente. Un nmero de casos especificado por el usuario. Tambin se debe
Los rangos de fechas y horas slo estn disponibles para los datos de serie
temporal con variables de fecha definidas (men Datos, Definir fechas).
236
Captulo 9
Figura 9-13
Cuadro de dilogo Seleccionar casos: Rango para rangos de casos (sin variables de fecha
definidas)
Figura 9-14
Cuadro de dilogo Seleccionar casos: Rango para datos de la serie temporal con variables
de fecha definidas
Ponderar casos
Ponderar casos proporciona a los casos diferentes ponderaciones (mediante una
rplica simulada) para el anlisis estadstico.
Los casos con valores perdidos, negativos o cero para la variable de ponderacin
se excluyen del anlisis.
237
Gestin y transformacin de los archivos
Figura 9-15
Cuadro de dilogo Ponderar casos
Si aplica una variable de ponderacin, sta seguir vigente hasta que se seleccione
otra o se desactive la ponderacin. Si guarda un archivo de datos ponderado,
la informacin de ponderacin se guardar con el archivo. Puede desactivar la
ponderacin en cualquier momento, incluso despus de haber guardado el archivo de
forma ponderada.
Ponderaciones en las tablas de contingencia. El procedimiento Tablas de contingencia
de dispersin y los histogramas tienen una opcin para activar y desactivar las
ponderaciones de los casos, pero dicha opcin no afecta a los casos que tienen un
valor negativo, un valor 0 o un valor perdido para la variable de ponderacin. Estos
casos permanecen excluidos del grfico incluso si se desactiva la ponderacin desde
el grfico.
Para ponderar casos
E Elija en los mens:
Datos
Ponderar casos...
E Seleccione Ponderar casos mediante.
E Seleccione una variable de frecuencia.
238
Captulo 9
Si lo desea, puede:
239
Gestin y transformacin de los archivos
Figura 9-16
Asistente de reestructuracin de datos
Transponer todos los datos. Seleccione esta opcin cuando desee transponer los
datos. Todas las filas se convertirn en columnas y todas las columnas en filas, en
el nuevo archivo de datos. Esta opcin cierra el Asistente de reestructuracin de
datos y abre el cuadro de dilogo Transponer datos.
240
Captulo 9
Una variable contiene informacin que se desea analizar, por ejemplo, una medida
o una puntuacin. Un caso es una observacin, por ejemplo, un individuo. En una
estructura de datos simple, cada variable es una nica columna de datos y cada caso
es una nica fila. De manera que, por ejemplo, si estuviera midiendo las puntuaciones
de un examen realizado a todos los alumnos de una clase, todos los valores de las
notas apareceran en una nica columna y habra una fila para cada alumno.
Cuando se analizan datos, a menudo se est analizando cmo vara una variable en
funcin de cierta condicin. Dicha condicin puede ser un tratamiento experimental
especfico, un grupo demogrfico, un momento en el tiempo u otra cosa. En el
anlisis de datos, a las condiciones de inters a menudo se las denomina factores.
Al analizar factores, se dispone de una estructura de datos compleja. Es posible
que haya informacin acerca de una variable en ms de una columna de datos (por
ejemplo, una columna para cada nivel de un factor), o que haya informacin acerca
de un caso en ms de una fila (por ejemplo, una fila para cada nivel de un factor).
El Asistente de reestructuracin de datos le ayuda a reestructurar archivos con una
estructura de datos compleja.
La estructura del archivo actual y la estructura que se desea en el nuevo archivo
determinan las elecciones que se deben seleccionar en el asistente.
Cmo estn organizados los datos en el archivo actual? Es posible que los datos
actuales estn organizados de manera que los factores estn registrados en una variable
diferente (como grupos de casos) o con la variable (como grupos de variables).
factor
241
Gestin y transformacin de los archivos
En este ejemplo, las dos primeras filas son un grupo de casos porque estn
relacionadas. Contienen datos para el mismo nivel del factor. En el anlisis de datos
de SPSS, cuando los datos estn estructurados de esta manera, se hace referencia al
factor como variable de agrupacin.
var_2
En este ejemplo, las dos primeras columnas son un grupo de variables porque estn
relacionadas. Contienen datos para la misma variable, var_1 para el nivel 1 del factor
y var_2 para el nivel 2 del factor. En el anlisis de datos de SPSS, si los datos se
estructuran de esta manera, el factor se suele denominar de medidas repetidas.
Cmo deben organizarse los datos en el archivo nuevo? Normalmente, la organizacin
estar determinada por el procedimiento que se vaya a utilizar para analizar los datos.
en grupos de casos para realizar los anlisis que requieran una variable de
agrupacin. Algunos ejemplos son: univariante, multivariante y componentes de
la varianza de los Modelos lineales generales; Modelos mixtos; Cubos OLAP;
y muestras independientes de las Pruebas T o Pruebas no paramtricas. Si la
estructura de datos actual es de grupos de variables y desea realizar estos anlisis,
seleccione Reestructurar variables seleccionadas en casos.
242
Captulo 9
Figura 9-17
Datos actuales para reestructurar variables a casos
243
Gestin y transformacin de los archivos
Cuando se ejecute la prueba t de muestras relacionadas, podr utilizar ant y des como
el par de variables.
244
Captulo 9
Figura 9-21
Asistente de reestructuracin de datos: Nmero de grupos de variables, paso 2
245
Gestin y transformacin de los archivos
En este paso, se debe proporcionar informacin sobre cmo se van a utilizar las
variables del archivo actual en el nuevo archivo. Tambin se puede crear una variable
que identifique las filas en el nuevo archivo.
Figura 9-22
Asistente de reestructuracin de datos: Seleccionar variables, paso 3
Cmo se deben identificar las nuevas filas? En el nuevo archivo de datos, puede crear
una variable que identifique la fila del archivo de datos actual que ha sido utilizada
para crear un grupo de filas nuevo. El identificador puede ser un nmero de caso
secuencial o los valores de una variable. Utilice los controles disponibles en el
apartado Identificacin de grupos de casos para definir la variable de identificacin
utilizada en el nuevo archivo. Pulse en la casilla para cambiar el nombre de variable
por defecto y para dotar a la variable de identificacin de una etiqueta de variable
descriptiva.
246
Captulo 9
la lista Variables que se van a transponer. Todas las variables del grupo debern ser
del mismo tipo (numricas o de cadena).
Se puede incluir la misma variable ms de una vez en el grupo de variables (las
variables se copian de la lista origen de variables en lugar de moverlas); los valores se
repetirn en el nuevo archivo.
Para especificar varias variables reestructuradas
E Seleccione la primera variable de destino que desea definir de la lista desplegable
Variable de destino.
E Ponga las variables que componen el grupo de variables que desea transformar en la
lista Variables que se van a transponer. Todas las variables del grupo debern ser del
mismo tipo (numricas o de cadena). Puede incluir la misma variable ms de una vez
en el grupo de variables. (Las variables se copian de la lista origen de variables en
lugar de moverlas, y los valores se repetirn en el nuevo archivo.)
E Seleccione la siguiente variable de destino que desea definir y repita el proceso de
247
Gestin y transformacin de los archivos
248
Captulo 9
Figura 9-23
Asistente de reestructuracin de datos: Crear variables de ndice, paso 4
Cuntas variables de ndice debe haber en el archivo nuevo? Las variables de ndice
archivo.
249
Gestin y transformacin de los archivos
El ndice comienza por 1 y se incrementa por cada variable del grupo. Vuelve a
comenzar cada vez que se encuentra una fila en el archivo original. Ahora se puede
utilizar ndice en procedimientos de SPSS que requieran una variable de agrupacin.
250
Captulo 9
Figura 9-26
Datos actuales para dos ndices
251
Gestin y transformacin de los archivos
Figura 9-28
Asistente de reestructuracin de datos: Crear una variable de ndice, paso 5
252
Captulo 9
que hay registrados en los datos actuales. Un nivel define un grupo de casos que
experimentan las mismas condiciones. Si hay varios factores, los datos actuales se
253
Gestin y transformacin de los archivos
deben organizar de manera que los niveles del primer factor sean un ndice primario
dentro del cual varan los niveles de los siguientes factores.
Cuntos niveles debe haber en el archivo nuevo? Introduzca el nmero de niveles
para cada ndice. Los valores para varias variables de ndice son siempre nmeros
secuenciales. Los valores comienzan en 1 y se incrementan con cada nivel. El primer
ndice se incrementa ms despacio y el ltimo ms deprisa.
Nmero total de niveles combinados. No se puede crear ms niveles de los que existen
en los datos actuales. Como los datos reestructurados contendrn una fila por cada
combinacin de tratamientos, el asistente realizar una comprobacin del nmero de
niveles que se crean. Comparar el producto de los niveles creados con el nmero
de variables del grupo de variables. Deben coincidir.
Nombres y etiquetas. Pulse en una casilla para cambiar el nombre de variable por
defecto y proporcionar una etiqueta de variable descriptiva para las variables de ndice.
254
Captulo 9
Figura 9-30
Asistente de reestructuracin de datos: Opciones, paso 6
255
Gestin y transformacin de los archivos
gran utilidad si decide descartar del nuevo archivo los valores nulos, ya que esto
conlleva la generacin de un nmero distinto de nuevas filas por una fila dada de los
datos actuales. Pulse en una casilla para cambiar el nombre de variable por defecto y
proporcionar una etiqueta de variable descriptiva para la variable de recuento.
256
Captulo 9
hay que hacer con las variables que quedan en la lista Archivo actual. Comprueba
cada variable para ver si los valores de los datos varan dentro de un grupo de casos. Si
hay alguna variacin, el asistente reestructurar los valores en un grupo de variables
en el nuevo archivo. Si no la hay, el asistente copiar los valores en el nuevo archivo.
257
Gestin y transformacin de los archivos
En este paso, debe decidir si se ordena el archivo actual antes de reestructurarlo. Cada
vez que el asistente se encuentra una nueva combinacin de valores de identificacin,
se crea una nueva fila, por lo tanto, es importante que los datos estn ordenados por
las variables que identifican los grupos de casos.
Figura 9-32
Asistente de reestructuracin de datos: Ordenacin de los datos, paso 3
Cmo estn ordenadas las filas en el archivo actual? Tenga en cuenta la ordenacin de
los datos actuales y cules son las variables que se estn utilizando para identificar
grupos de casos (especificadas en el paso anterior).
258
Captulo 9
datos, pero garantiza que las filas estn correctamente ordenadas antes de la
reestructuracin.
No. El asistente no ordenar los datos actuales. Seleccione esta opcin cuando
est seguro de que los datos actuales estn ordenados en funcin de las variables
que identifican los grupos de casos.
259
Gestin y transformacin de los archivos
Por variable. El asistente agrupa juntas las nuevas variables creadas a partir de
Por ndice. El asistente agrupa las variables en funcin de los valores de las
variables de ndice.
Ejemplo. Las variables que se van a reestructurar son w y h, y el ndice es mes:
w
mes
w.feb
h.ene
h.ene
w.feb
Desea crear una variable de recuento? El asistente puede crear una variable de
recuento en el nuevo archivo. Dicha variable contendr el nmero de filas de los datos
actuales que se utilizaron para crear una fila en el nuevo archivo de datos.
Desea crear variables indicadoras? El asistente puede utilizar las variables de ndice
para crear variables indicadoras en el nuevo archivo de datos. Crear una nueva
variable por cada valor nico de la variable de ndice. Las variables indicadoras
indican la presencia o ausencia de un valor para un caso. Una variable indicadora
toma el valor 1 si el caso tiene un valor; en caso contrario, vale 0.
Ejemplo. La variable de ndice es producto. Registra los productos que ha comprado
un cliente. Los datos originales son:
cliente
producto
pollo
huevos
huevos
pollo
260
Captulo 9
La creacin de una variable indicadora da como resultado una nueva variable para
cada valor nico de producto. Los datos reestructurados son:
cliente
indpollo
indhuevos
En este ejemplo, se pueden utilizar los datos reestructurados para obtener recuentos
de frecuencias de los productos que compran los clientes.
261
Gestin y transformacin de los archivos
Figura 9-34
Asistente de reestructuracin de datos: Finalizar
Captulo
10
Visor
Los resultados se muestran en el Visor. Puede utilizar el Visor para:
263
264
Captulo 10
Figura 10-1
Visor
Puede utilizar las barras de desplazamiento para examinar los resultados o bien
pulsar en un elemento de los titulares para ir directamente a la tabla o grfico
correspondientes. Puede pulsar y arrastrar el borde derecho del panel de titulares para
cambiar la anchura del mismo.
265
Trabajo con resultados
o
E Pulse en el elemento para seleccionarlo.
E Elija en los mens:
Ver
Ocult.
o
E Pulse en el icono de libro cerrado (Ocultar) de la barra de herramientas de titulares.
266
Captulo 10
titulares.
Se ocultarn todos los resultados del procedimiento y se contraer la presentacin de
titulares.
tecla Mays para seleccionar mltiples elementos o la tecla Ctrl para seleccionar
elementos no contiguos.)
E Pulse y arrastre los elementos seleccionados (mantenga pulsado el botn del ratn
mientras arrastra).
E Suelte el botn del ratn en el elemento situado justamente encima de la ubicacin
tecla Mays para seleccionar mltiples elementos o la tecla Ctrl para seleccionar
elementos no contiguos.)
267
Trabajo con resultados
E Pulse Supr.
o
E Elija en los mens:
Edicin
Borrar
tecla Mays para seleccionar mltiples elementos o la tecla Ctrl para seleccionar
elementos no contiguos.)
E Mantenga pulsada la tecla Ctrl mientras pulsa y arrastra los elementos seleccionados
Tambin puede copiar elementos con las opciones Copiar y Pegar detrs del men
Edicin.
(mantenga pulsada la tecla Mays o la tecla Ctrl para seleccionar mltiples elementos).
E Elija en los mens:
Formato
Alineacin izquierda
268
Captulo 10
Nota: Todos los resultados aparecen alineados a la izquierda en el Visor. Los ajustes
de alineacin slo afectan a los resultados. Los elementos con alineacin centrada y
a la derecha se identifican por un pequeo smbolo situado encima y a la izquierda
del elemento.
269
Trabajo con resultados
Figura 10-2
Vista de titulares contrada y resultados ocultos
puede:
contraer o expandir.
o
E Pulse en el elemento de los titulares.
270
Captulo 10
E Elija en los mens:
Ver
Contraer
o
Ver
Expandir
o
Edicin
Resaltado
Descender
271
Trabajo con resultados
o
Insertar
Nuevo texto
E Pulse dos veces en el nuevo objeto.
E Introduzca el texto que desee en esta ubicacin.
272
Captulo 10
E Elija en los mens:
Insertar
Archivo de texto...
E Seleccione un archivo de texto.
aplicaciones con formato RTF. En la mayora de las aplicaciones, esto significa que
la tabla pivote se pega como una tabla que puede editarse posteriormente en la otra
aplicacin.
Mapa de bits. Los grficos pueden pegarse en otras aplicaciones como mapas de bits.
BIFF. El contenido de una tabla se puede pegar en una hoja de clculo y conservar
la precisin numrica.
Texto. El contenido de una tabla se puede copiar y pegar como texto. Este proceso
puede ser til en aplicaciones como el correo electrnico, donde slo se puede aceptar
o transmitir texto.
273
Trabajo con resultados
o
Edicin
Pegado especial...
274
Captulo 10
SPSS.
Esta accin activar la incrustacin ActiveX para las tablas pivote. El archivo
objs-off.bat desactiva la incrustacin ActiveX.
Para incrustar una tabla pivote o un grfico interactivo en otra aplicacin:
E Copie la tabla en el Visor.
E Elija en los mens de la aplicacin de destino:
Edicin
Pegado especial...
E En la lista, seleccione Objeto Tabla pivote de SPSS u Objeto de control de grficos
de SPSS.
El elemento se pegar como metarchivo. Slo la capa y las columnas visibles cuando
se copi el elemento estarn disponibles en el metarchivo. Las otras capas o las
columnas ocultas no estarn disponibles.
275
Trabajo con resultados
Al realizar esta operacin, la tabla pivote se pegar como una tabla. Slo se pegarn
en la tabla la capa y las columnas que estaban visibles cuando se copi el elemento.
Las otras capas o las columnas ocultas no estarn disponibles. Con este formato slo
es posible copiar y pegar una tabla pivote cada vez.
El texto sin formato de la tabla pivote contiene tabuladores entre columnas. Las
columnas se pueden alinear ajustando los tabuladores en la otra aplicacin.
276
Captulo 10
Nota: Utilice la opcin Copiar objetos slo para copiar varios elementos del Visor en
otra aplicacin. Para copiar y pegar dentro de los documentos del Visor (por ejemplo,
entre dos ventanas del Visor), utilice el comando Copiar del men Edicin.
Pegado especial
Pegado especial permite seleccionar el formato de un objeto copiado que se pega
en el Visor. Los tipos de archivo posibles para el objeto se muestran en el cuadro
de dilogo Pegado especial El objeto se insertar en el Visor despus del objeto
actualmente seleccionado.
Figura 10-3
Cuadro de dilogo Pegado especial
277
Trabajo con resultados
E En el panel de titulares o en el panel de contenidos del Visor, pulse en la tabla, en el
Exportar resultados
Con Exportar resultados se guardan las tablas pivote y los resultados de texto en
formato HTML, texto, Word/RTF, Excel y PowerPoint (requiere PowerPoint 97 o
posterior) y, asimismo, se guardan los grficos en una amplia variedad de formatos
comunes utilizados por otras aplicaciones. (Nota: en la versin para estudiantes no
est disponible la exportacin a PowerPoint.)
Documento de salida. Exporta cualquier combinacin de tablas pivote, resultados
de texto y grficos.
Para los formatos Word o RTF, los grficos se exportan en formato de metarchivo
de Windows y se incrustan en el documento de Word.
278
Captulo 10
Exportar qu. Permite exportar todos los objetos del Visor, todos los objetos visibles o
son HTML, texto, Excel, Word/RTF y PowerPoint, mientras que para los formatos
HTML y de texto, los grficos se exportan en el formato de grfico seleccionado
actualmente en el cuadro de dilogo Opciones para el formato seleccionado. Para
Slo grficos, seleccione un formato de exportacin del grfico en la lista desplegable.
Para exportar documentos de resultados, tablas pivote y texto, siga las instrucciones
siguientes:
Archivo HTML (*.htm). Las tablas pivote se exportan como tablas HTML. Los
Archivo de texto (*.txt). Las tablas pivote se pueden exportar en formato separado
Archivo de Excel (*.xls). Las filas, columnas y casillas de tablas pivote se exportan
como filas, columnas y casillas de Excel, con todos los atributos de formato
intactos, por ejemplo, bordes de casilla, estilos de fuente y colores de fondo, etc.
Los resultados de texto se exportan con todos los atributos de fuente intactos.
Cada lnea del resultado de texto constituye una fila del archivo de Excel y se
incluye todo su contenido en una sola casilla.
Archivo de Word/RTF (*.doc). Las tablas pivote se exportan como tablas de Word,
con todos los atributos de formato intactos (por ejemplo, bordes de casilla,
estilos de fuente, colores de fondo, etc.). Los resultados de texto se exportan en
formato RTF. Los resultados de texto siempre se muestran en SPSS con un tipo
de letra de paso fijo (monoespaciadas) y se exportan con los mismos atributos
de fuente. Es necesario utilizar una fuente de paso fijo para que los resultados
de texto separado por espacios queden correctamente alineados; por defecto, la
mayora de los navegadores de Web utilizan una fuente de paso fijo para el texto
con formato previo.
Archivo PowerPoint (*.ppt). Las tablas pivote se exportan como tablas de Word
279
Trabajo con resultados
necesario utilizar una fuente de paso fijo para que los resultados de texto separado
por espacios queden correctamente alineados; por defecto, la mayora de los
navegadores de Web utilizan una fuente de paso fijo para el texto con formato
previo. (Nota: en la versin para estudiantes no est disponible la exportacin a
PowerPoint.)
Sistema de gestin de resultados. Puede exportar automticamente adems todos los
de exportacin.
Figura 10-4
Cuadro de dilogo Exportar resultados
280
Captulo 10
Figura 10-5
Resultados exportados en formato Word/RTF
incluido el tamao de los grficos para documentos HTML. Para los formatos Word o
RTF, todos los grficos se exportan en formato de metarchivo de Windows (WMF).
No se incluyen grficos para los documentos de Excel.
Mantener las notas y el texto al pie al exportar. Seleccione esta casilla para incluir las
notas y el texto al pie en la exportacin de tablas pivote.
281
Trabajo con resultados
Exportar todas las capas. Seleccione esta casilla para exportar todas las capas de
una tabla pivote de varias capas. Si no selecciona la casilla, slo se exportar la
capa superior.
exportacin.
E Pulse en Opciones.
Opciones de PowerPoint
Opciones de PowerPoint controla la inclusin de los ttulos de diapositivas, la
inclusin de notas y textos al pie para las tablas pivote, la gestin de tablas pivote de
varias capas y las opciones para los grficos exportados a PowerPoint. (Nota: en la
versin para estudiantes no est disponible la exportacin a PowerPoint.)
Figura 10-6
Cuadro de dilogo Opciones de PowerPoint
Incluir el ttulo en la diapositiva. Seleccione esta casilla para incluir un ttulo en cada
282
Captulo 10
Mantener las notas y el texto al pie al exportar. Seleccione esta casilla para incluir las
notas y el texto al pie en la exportacin de tablas pivote.
Exportar todas las capas. Seleccione esta casilla para exportar todas las capas de una
tabla pivote de varias capas. Cada capa se colocar en una diapositiva distinta y todas
las capas tendrn el mismo ttulo. Si no selecciona esta casilla, slo se exportar la
capa superior.
Las tablas pivote se pueden exportar en formato separado por tabuladores o por
espacios. Para el formato separado por tabuladores, si una casilla no est vaca, se
imprimir su contenido y un tabulador. Si una casilla est vaca, se imprimir un
tabulador.
283
Trabajo con resultados
los caracteres que se emplean para crear los bordes de las casillas.
Formato de imagen. Controla el formato de exportacin de los grficos y otros ajustes,
entre cada tabla. En el caso de las tablas pivote de varias capas, esta opcin inserta un
salto de pgina entre cada capa.
284
Captulo 10
E Elija en los mens:
Archivo
Exportar...
E En el caso de los documentos de resultados, pulse en Opciones, seleccione el formato
de exportacin y, a continuacin, pulse en Tamao del grfico.
E En el caso de Slo grficos, seleccione el formato de exportacin y, a continuacin,
pulse en Tamao del grfico.
285
Trabajo con resultados
286
Captulo 10
287
Trabajo con resultados
Para los rboles (opcin rboles de clasificacin), los mapas (opcin Mapas) y
para los grficos interactivos (men Grficos, submen Interactivo) se encuentran
disponibles las siguientes opciones de EPS:
Vista previa de las imgenes. Permite guardar una imagen de vista previa en la imagen
EPS. Una imagen de vista previa se utiliza principalmente si se ubica un archivo EPS
en otro documento. Muchas aplicaciones no pueden mostrar ninguna imagen EPS en
la pantalla, pero s pueden mostrar la vista previa que se ha guardado con la imagen.
La vista previa de la imagen puede ser WMF (de menor tamao y ms escalable) o
TIFF (porttil y admitida por otras plataformas). Compruebe la aplicacin en que
desea incluir el grfico EPS para ver qu formato de vista previa admite la aplicacin.
Fuentes. Controla el tratamiento de fuentes TrueType en las imgenes EPS.
Sustituir fuentes con curvas. Convierte las fuentes TrueType en datos de curvas
288
Captulo 10
Otros grficos
Sustituir fuentes con curvas. Convierte las fuentes en datos de curvas PostScript.
El texto ya no se puede editar como texto en las aplicaciones que pueden editar
los grficos EPS. Esta opcin es til si las fuentes que se utilizan en el grfico no
estn disponibles en el dispositivo de los resultados.
tamao fsico que cuando se abre a 96 ppp x 120 ppp), pero no todas las aplicaciones
admiten este formato.
Windows estndar. Lo admiten la mayora de las aplicaciones que pueden mostrar
metarchivos de Windows.
289
Trabajo con resultados
290
Captulo 10
Presentacin preliminar
Presentacin preliminar muestra lo que se imprimir en cada pgina de los
documentos del Visor. Es una buena idea comprobar la presentacin preliminar antes
de imprimir un documento del Visor, ya que muestra elementos que quiz no puedan
verse en el panel de contenidos; entre ellos:
291
Trabajo con resultados
Figura 10-10
Presentacin preliminar
292
Captulo 10
Configuracin de pgina
Con Preparar pgina, se puede controlar:
Numeracin de pginas
Figura 10-11
Cuadro de dilogo Preparar pgina
293
Trabajo con resultados
La fecha y la hora
294
Captulo 10
Figura 10-12
Pestaa Cabecera/Pie del cuadro de dilogo Opciones de Preparar pgina:
Las etiquetas de las cabeceras de los titulares indican el primer, el segundo, el tercer
y/o el cuarto nivel de cabecera del titular para el primer elemento en cada pgina.
Los ttulos y los subttulos de pgina imprimen los ttulos y subttulos de pgina
actuales. Los ttulos y los subttulos de pgina se crean con la opcin Nuevo ttulo de
pgina del men Insertar del Visor o con los comandos TITLE y SUBTITLE de la
sintaxis de comandos. Si no ha especificado ningn ttulo ni subttulo de pgina, este
ajuste no se tendr en cuenta.
Nota: las caractersticas de las fuentes de los nuevos ttulos y subttulos de pgina
se controlan en la pestaa Visor del cuadro de dilogo Opciones (a la que se accede
al seleccionar Opciones en el men Edicin). Tambin se pueden cambiar las
caractersticas de los ttulos y subttulos de pgina existentes editndolos en el Visor.
Para ver cmo aparecern los encabezados y pies en la pgina impresa, seleccione
Presentacin preliminar del men Archivo.
295
Trabajo con resultados
tabla pivote, grfico y objeto de texto es un elemento diferente. Este ajuste no afecta a
la presentacin de los elementos en el Visor.
Numerar las pginas empezando por. Numera las pginas secuencialmente, empezando
296
Captulo 10
Figura 10-13
Pestaa Opciones del cuadro de dilogo Opciones de Preparar pgina:
Almacenamiento de resultados
El contenido del Visor puede guardarse en un documento del Visor. El documento
incluir los dos paneles de la ventana del Visor (titulares y contenidos).
Para guardar los resultados en otros formatos externos (por ejemplo, HTML o texto),
utilice el comando Exportar del men Archivo. (Esta caracterstica no est disponible
en el programa SmartViewer independiente.)
297
Trabajo con resultados
Nota: deje en blanco el espacio destinado al cdigo OEM a menos que tenga un
acuerdo contractual con SPSS Inc. para distribuir SmartViewer.
Captulo
Visor de borrador
11
Puede editar los resultados de texto en el Visor de borrador, cambiar el tamao de los
grficos y pegar tanto los resultados de texto como los grficos en otras aplicaciones.
Sin embargo, no es posible editar los grficos ni disponer de las funciones interactivas
de las tablas pivote y los grficos.
299
300
Captulo 11
Figura 11-1
Ventana Visor de borrador
en los mens:
Edicin
Opciones...
E Pulse en la pestaa General.
E Seleccione Borrador en Tipo de visor al inicio.
301
Visor de borrador
Nota: Los nuevos resultados se muestran siempre en la ventana designada del Visor.
Si tiene abiertas una ventana del Visor y una del Visor de borrador, la ventana
designada ser la que se haya abierto ms recientemente o la designada mediante el
botn Designar ventana (el signo de exclamacin) de la barra de herramientas.
Los caracteres de caja de la fuente SPSS Marker Set se utilizan para los
separadores de filas y columnas.
Puede controlar el formato de los nuevos resultados de borrador mediante las opciones
del Visor de borrador (men Edicin, Opciones, pestaa Visor de borrador).
302
Captulo 11
Figura 11-2
Opciones del Visor de borrador
Ancho de columna. Para reducir el ancho de las tablas que contienen etiquetas de gran
longitud, seleccione la opcin de mximo de caracteres en Ancho de columna. Las
etiquetas que exceden el ancho especificado se ajustan a este valor mximo aplicando
lneas de separacin.
303
Visor de borrador
Figura 11-3
Resultados de borrador antes y despus de establecer el ancho mximo de columna
Separadores de filas y de columnas. En vez de los caracteres de caja para los bordes
de filas y columnas, se pueden utilizar las opciones de Separadores de casillas para
controlar la presentacin de los separadores de filas y columnas en los resultados de
borrador. Puede especificar diferentes separadores de casillas o introducir espacios
en blanco si no desea emplear ningn carcter para marcar las filas y las columnas.
Tendr que anular la seleccin de Mostrar caracteres de caja para especificar los
separadores de casillas.
304
Captulo 11
Figura 11-4
Resultados de borrador antes y despus de establecer los separadores de casillas
Visor de borrador se ha diseado para presentar los resultados separados por espacios
en una fuente de paso fijo (monoespaciada). Si desea pegar los resultados de borrador
en otra aplicacin, deber utilizar este tipo de fuente para que las columnas separadas
por espacios queden bien alineadas. Si selecciona Tabuladores como separadores de
columnas, podr utilizar cualquier fuente que desee en la otra aplicacin y definir los
tabuladores para alinear los resultados correctamente. Sin embargo, en el Visor de
borrador, los resultados separados por tabuladores no se alinearn correctamente.
305
Visor de borrador
Figura 11-5
Resultados separados por tabuladores en el Visor de borrador y formateados en un
procesador de textos.
306
Captulo 11
Las opciones de presentacin de resultados del Visor de borrador slo afectan a los
resultados producidos tras el cambio de las especificaciones. Los cambios en la
configuracin no afectan al resultado mostrado en el Visor de borrador.
Atributos de fuente
Es posible modificar los atributos de fuente (como fuente, tamao y estilo) de los
resultados de texto del Visor de borrador. En cualquier caso, si utiliza caracteres
de caja para los bordes de las filas y las columnas, para que la alineacin del texto
separado por espacio en las columnas sea correcta, ser necesaria una fuente de paso
fijo (monoespaciada), por ejemplo, Courier. Asimismo, la modificacin de otros
atributos de fuente como el tamao y el estilo (por ejemplo, negrita o cursiva) slo en
una parte de la tabla puede afectar tambin a la alineacin de las columnas.
Bordes de filas y columnas. Los bordes de lnea slidos para las filas y las columnas
utiliza, por defecto, la fuente SPSS Marker Set. Las dems fuentes no permiten los
caracteres de dibujo de lneas utilizados para trazar los bordes.
307
Visor de borrador
E Elija en los mens:
Archivo
Imprimir...
E Elija Seleccin.
Tablas muy anchas producidas por los resultados de tablas pivote convertidas sin
especificacin del ancho de columna.
Los resultados demasiado anchos para la pgina no se imprimen en otra pgina, sino
que se truncan. Existen varios mtodos para evitar esto:
Para los nuevos resultados, especifique un valor bajo para el ancho de columna
mximo (men Edicin, Opciones, pestaa Visor de borrador).
En las tablas de gran longitud, utilice saltos de pgina (men Insertar, Salto de pgina)
para controlar la ubicacin de los saltos en la tabla.
308
Captulo 11
Los resultados del Visor de borrador se guardan con formato RTF (formato de texto
enriquecido).
Captulo
12
Tablas pivote
Muchos de los resultados del Visor se presentan en tablas que se pueden pivotar de
forma interactiva. Es decir, puede reorganizar las filas, columnas y capas.
310
Captulo 12
E Repita el proceso para cada tabla pivote que desee editar.
Cada tabla pivote aparecer en una ventana independiente lista para ser editada.
311
Tablas pivote
E Pulse y mantenga pulsado el botn del ratn en un icono.
Esta operacin tiene el mismo efecto que si se arrastraran todos los iconos de fila
hasta el panel Columna y todos los iconos de columna hasta el panel Fila.
Nota: Asegrese de que Arrastrar para copiar en el men Edicin no no est activado
(marcado). Si est activada, anule su seleccin.
312
Captulo 12
y arrastre, o bien mantenga pulsada la tecla Mays para seleccionar varias etiquetas.
E Elija en los mens:
Edicin
Grupo
Nota: Para aadir filas o columnas a un grupo existente, deber desagrupar los
elementos actuales del grupo y crear despus un nuevo grupo que incluya los
elementos adicionales.
desagrupar.
E Elija en los mens:
Edicin
Desagrupar
313
Tablas pivote
o
Rotar etiquetas de fila exterior
Figura 12-3
Etiquetas de columna rotadas
Slo se pueden rotar las etiquetas de columna ms al interior y las etiquetas de fila
ms al exterior.
Esta operacin slo restablece los cambios que son el resultado de pivotar los
elementos de fila, columna y capa entre dimensiones. Esta accin no afecta a cambios
tales como la agrupacin, la desagrupacin o el desplazamiento de filas y columnas.
314
Captulo 12
Debe pulsar con el botn derecho del ratn en la propia casilla de etiqueta, no en
las casillas de datos de la fila o la columna. La ayuda sensible al contexto no se
encuentra disponible para las etiquetas definidas por el usuario, como pueden ser los
nombres de variable o las etiquetas de valor.
315
Tablas pivote
Figura 12-4
Desplazamiento de categoras a las capas
Pivota las minoras de fila
a las dimensiones de capa
Cada icono de capa tiene flechas izquierda y derecha. La tabla visible es la tabla
de la capa superior.
Figura 12-5
Categoras en capas distintas
o
E Seleccione una categora de la lista desplegable de capas.
316
Captulo 12
Figura 12-6
Seleccin de capas en las listas desplegables
Ir a la categora de capa
Ir a la categora de capa permite cambiar las capas de una tabla pivote. Este cuadro
de dilogo es particularmente til cuando hay un gran nmero de capas o una capa
con muchas categoras.
317
Tablas pivote
E En la lista Categora visible, seleccione una dimensin de capa. La lista Categoras
o
E En el men Pivotar, seleccione Mover capas a columnas.
Tambin puede mover las capas a las filas o a las columnas arrastrando sus iconos
entre los paneles de pivotado Capa, Fila y Columna.
Sealizadores
Con los sealizadores puede guardar diferentes presentaciones de una tabla pivote.
Los sealizadores guardan:
318
Captulo 12
E Elija en los mens:
Pivotar
Sealizadores
E Escriba un nombre para el sealizador. (Los nombres de los sealizadores no
319
Tablas pivote
ocultar.
E Elija en los mens de la tabla pivote:
Ver
Ocult.
o
E Pulse con el botn derecho del ratn en la fila o columna.
E En el men contextual, seleccione Ocultar categora.
320
Captulo 12
E Elija en los mens de la tabla pivote:
Ver
Mostrar todo
la dimensin.
E Elija en los mens:
Ver
Ocultar (o Mostrar) etiqueta de dimensin
321
Tablas pivote
Modificar el texto.
Aspectos de tabla
Un aspecto de tabla es un conjunto de propiedades que definen el aspecto de una
tabla. Puede seleccionar un aspecto previamente definido o crear uno propio.
Antes o despus de aplicar un aspecto de tabla, se pueden cambiar los formatos
de casillas individuales o de grupos de casillas utilizando las propiedades de casilla.
Los formatos de casilla editados se conservan intactos, aunque se aplique un nuevo
aspecto de tabla.
Por ejemplo, puede comenzar aplicando el aspecto de tabla 9POINT; a
continuacin, seleccionar una columna de datos y, en el cuadro de dilogo Formatos
de casilla, cambiar dicha columna a una fuente en negrita. Despus, puede cambiar
el aspecto de tabla a BOXED. La columna previamente seleccionada conservar
322
Captulo 12
323
Tablas pivote
lista de archivos.
E Pulse en Editar aspecto.
E Edite las propiedades de la tabla seleccionando los atributos que desee y, a
continuacin, pulse en Aceptar.
E Pulse en Guardar aspecto para guardar el aspecto de tabla editado, o en Guardar como
Propiedades de tabla
El cuadro de dilogo Propiedades de tabla permite establecer las propiedades
generales de una tabla, definir los estilos de casilla de varias partes de la tabla y
guardar un conjunto de esas propiedades como un aspecto de tabla. Utilizando las
pestaas de este cuadro de dilogo puede:
Determinar formatos especficos para las casillas en el rea de datos, para las
etiquetas de fila y columna y para otras reas de la tabla.
Controlar la anchura y el color de las lneas que forman los bordes de cada rea
de la tabla.
324
Captulo 12
E Elija una pestaa (General, Notas al pie, Formatos de casilla, Bordes o Impresin).
E Seleccione las opciones que desee.
E Pulse en Aceptar o Aplicar.
Mostrar u ocultar filas y columnas vacas. (Una fila o una columna vaca no
contiene nada en ninguna casilla de datos.)
325
Tablas pivote
Figura 12-9
Pestaa General del cuadro de dilogo Propiedades de tabla
El estilo de los marcadores de las notas al pie puede ser nmeros (1, 2, 3...) o
letras (a, b, c...).
Los marcadores de las notas al pie se pueden anexar al texto como superndices o
como subndices.
326
Captulo 12
Figura 12-10
Pestaa Notas al pie del cuadro de dilogo Propiedades de tabla
327
Tablas pivote
Figura 12-11
reas de una tabla
328
Captulo 12
Figura 12-12
Pestaa Formatos de casilla del cuadro de dilogo Propiedades de tabla
329
Tablas pivote
Figura 12-13
Pestaa Bordes del cuadro de dilogo Propiedades de tabla
una lnea del rea de muestra. (Mantenga pulsada la tecla Mays para seleccionar
varios nombres o la tecla Ctrl para seleccionar nombres no contiguos).
E Seleccione un estilo de lnea o Ninguno.
E Elija un color.
E Pulse en Aceptar o Aplicar.
330
Captulo 12
Imprimir todas las capas o slo la capa superior de la tabla e imprimir cada
capa en una pgina distinta. (Este ajuste slo afecta a la impresin, no a la
presentacin de las capas en el Visor).
Controlar las lneas viudas y hurfanas mediante el control del nmero mnimo
de filas y columnas que podr incluir cualquier seccin impresa de una tabla si
sta es demasiado ancha o larga para el tamao de pgina definido. (Nota: Si
una tabla es demasiado larga para que quepa en la pgina actual porque hay
otros resultados en la pgina por encima de ella pero cabe en la longitud de
pgina definida, la tabla se imprimir automticamente en una nueva pgina,
independientemente del valor de lneas viudas/hurfanas establecido.
Incluir el texto de continuacin para las tablas que no quepan en una sola pgina.
Este texto puede mostrarse en la parte inferior o superior de cada pgina. Si no
selecciona ninguna de estas opciones, no aparecer el texto de continuacin.
331
Tablas pivote
E Pulse en Aceptar o Aplicar.
Fuente
Un aspecto de tabla permite especificar las caractersticas de fuente de las distintas
reas de la tabla. Puede cambiar asimismo la fuente de una casilla individual. Las
opciones de fuente de una casilla incluyen el aspecto, el estilo, el tamao y el color de
la fuente. Tambin puede ocultar el texto o subrayarlo.
Si especifica las propiedades de fuente de una casilla, stas se aplicarn a todas las
capas de la tabla que tengan la misma casilla.
Figura 12-14
Cuadro de dilogo Fuente
332
Captulo 12
derecho de la columna que desee cambiar. (El puntero cambiar a una flecha con dos
puntas.)
E Mantenga pulsado el botn del ratn mientras arrastra el borde hasta su nueva
posicin.
333
Tablas pivote
Figura 12-16
Cambio del ancho de una columna
dos puntas.
E Arrastre el borde hasta conseguir el nuevo ancho.
Propiedades de casilla
Las opciones de Propiedades de casilla slo se aplican a una casilla individual
seleccionada. Puede cambiar el formato del valor, la alineacin, los mrgenes y
el sombreado. Las propiedades de casilla anulan las propiedades de tabla; por
tanto, si modifica estas ltimas, no cambiarn las propiedades de casilla aplicadas
individualmente.
334
Captulo 12
335
Tablas pivote
E Pulse en la pestaa Valor.
E Seleccione el formato que desea aplicar a la columna.
Puede utilizar este mtodo para suprimir o aadir signos de porcentaje y de dlar,
cambiar el nmero de decimales que se muestran y alternar entre la presentacin
numrica regular y la notacin cientfica.
336
Captulo 12
E Pulse en la pestaa Alineacin.
A medida que seleccione las propiedades de alineacin para la casilla, stas se irn
reflejando en el rea Muestra.
337
Tablas pivote
338
Captulo 12
Figura 12-21
Cuadro de dilogo Marcador de nota al pie
339
Tablas pivote
E Pulse en una etiqueta de fila o de columna.
E Elija en los mens:
Edicin
Seleccione
Casillas de datos y etiquetas
o
E Pulse las teclas Ctrl+Alt y en una etiqueta de fila o de columna.
de la casilla.
340
Captulo 12
En las tablas pivote multidimensionales (tablas con capas), puede imprimir todas
las capas o slo la capa superior (la visible).
Utilice Presentacin preliminar, en el men Archivo, para ver cmo aparecern las
tablas pivote en la pgina impresa.
Tambin puede imprimir cada capa de una tabla pivote en una hoja diferente.
341
Tablas pivote
Controlar la posicin de las filas y las columnas por donde se dividen las tablas
de gran tamao.
Especificar las filas y las columnas que deben permanecer unidas cuando se
dividen las tablas.
Ajustar las tablas de gran tamao para que quepan en el tamao de pgina
definido.
Para especificar las rupturas de filas y columnas para las tablas pivote
impresas
E Active la tabla pivote.
E Pulse en la etiqueta de la columna situada a la izquierda del lugar donde desee insertar
Para especificar las filas o las columnas que se han de mantener unidas
E Active la tabla pivote.
E Seleccione las etiquetas de las filas o columnas que desee mantener unidas. (Pulse y
arrastre, o bien mantenga pulsada la tecla Mays para seleccionar varias etiquetas
de fila o columna.)
E Elija en los mens:
Formato
Mantener juntos
342
Captulo 12
Para ajustar la escala de una tabla pivote para que quepa en el tamao de
la pgina
E Active la tabla pivote.
E Elija en los mens:
Formato
Propiedades de tabla
E Pulse en la pestaa Impresin.
E Seleccione Reducir tabla ancha para caber en la pgina.
y/o
E Seleccione Reducir tabla larga para caber en la pgina.
Captulo
13
343
344
Captulo 13
Reglas de la sintaxis
Al ejecutar comandos desde una ventana de sintaxis de comandos en el transcurso
de una sesin de SPSS, lo har en modo interactivo.
Las siguientes reglas se aplican a las especificaciones de los comandos en el modo
interactivo:
Cada comando debe terminar con un punto como terminador del comando. Sin
embargo, es mejor omitir el terminador en BEGIN DATA, para que los datos
interactivos se traten como una especificacin continua.
Nota: para que exista compatibilidad con otros modos de ejecucin de comandos
(incluidos los archivos de comandos que se ejecutan con los comandos INSERT
o INCLUDE en una sesin interactiva), la sintaxis de lnea de comandos no debe
exceder los 256 bytes.
El texto incluido entre apstrofos o comillas debe ir contenido en una sola lnea.
Los nombres de variable que terminen en un punto pueden causar errores en los
comandos creados por los cuadros de dilogo. No es posible crear nombres de
variable de este tipo en los cuadros de dilogo y en general deben evitarse.
345
Trabajar con sintaxis de comandos
y
freq var=catlab sexo /percent=25 50 75 /bar.
Las lneas no pueden exceder los 256 bytes; los caracteres adicionales quedarn
truncados.
346
Captulo 13
347
Trabajar con sintaxis de comandos
Figura 13-1
Sintaxis de comandos pegada desde un cuadro de dilogo
Nota: Si abre un cuadro de dilogo a partir de los mens de una ventana de proceso, el
cdigo para ejecutar la sintaxis desde un proceso se pegar en la ventana de proceso.
348
Captulo 13
Figura 13-2
Sintaxis de comando en la anotacin
Mientras ejecuta los anlisis, los comandos de las selecciones del cuadro de dilogo
se graban en la anotacin.
E Abra un archivo de sintaxis previamente guardado o cree uno nuevo. Para crear un
349
Trabajar con sintaxis de comandos
E En el Visor, pulse dos veces en un elemento de anotacin para activarlo.
E Pulse y arrastre el ratn para resaltar la sintaxis que desee copiar.
E Seleccione en los mens del Visor:
Edicin
Copiar
E En una ventana de sintaxis, elija en los mens:
Edicin
Pegar
350
Captulo 13
Figura 13-3
Edicin del archivo de diario
temp).
En la lista desplegable Archivo de tipo seleccione Todos los archivos (*.*) o escriba
*.jnl en el cuadro de texto Nombre de archivo para mostrar los archivos de diario en la
lista. Si tiene dificultades para localizar el archivo, consulte las Opciones en el men
Edicin para ver dnde se guarda el diario en su sistema.
E Edite el archivo para eliminar los mensajes de error o de advertencia que contenga,
nombre de archivo con la extensin .sps, la extensin por defecto de los archivos de
sintaxis.)
351
Trabajar con sintaxis de comandos
parcialmente resaltados.
Hasta el final. Ejecuta todos los comandos incluidos desde la posicin actual del
352
Captulo 13
Funciones de retardo
y
COMPUTE lagvar=LAG(var1)
EXECUTE
COMPUTE var1=var1*2
ofrece resultados muy diferentes para el valor de lagvar dado que el anterior utiliza el
valor transformado de var1 mientras que el ltimo utiliza el valor original.
Captulo
14
Frecuencias
En los resultados podra observar que el 37,5% de sus clientes pertenece a agencias
gubernamentales, el 24,9% a corporaciones, el 28,1% a instituciones acadmicas, y el
9,4% a la industria sanitaria. Con respecto a los datos continuos, cuantitativos, como
los ingresos por ventas, podra comprobar que el promedio de ventas de productos es
de 3.576 dlares con una desviacin tpica de 1.078 dlares.
Estadsticos y grficos. Frecuencias, porcentajes, porcentajes acumulados, media,
354
Captulo 14
robustos, tales como la mediana, los cuartiles y los percentiles son apropiados para las
variables cuantitativas que pueden o no cumplir el supuesto de normalidad.
Figura 14-1
Resultados de Frecuencias
355
Frecuencias
Figura 14-2
Cuadro de dilogo Frecuencias
Si lo desea, puede:
Frecuencias: Estadsticos
Figura 14-3
Cuadro de dilogo Frecuencias: Estadsticos
356
Captulo 14
Valores percentiles. Los valores de una variable cuantitativa que dividen los datos
Mediana. Valor por encima y por debajo del cual se encuentran la mitad de los
Moda. El valor que ocurre con mayor frecuencia. Si varios valores comparten la
Suma. La suma o total de todos los valores, a lo largo de todos los casos que no
los datos, incluyen: Desviacin tpica, Varianza, Rango, Mnimo, Mximo y Error
tpico de la media.
normal, el 68% de los casos se encuentra dentro de una desviacin tpica respecto
a la media y el 95% de los casos se encuentra dentro de dos desviaciones tpicas
respecto a la media. Por ejemplo, si la media de edad es 45, con una desviacin
tpica de 10, el 95% de los casos estara entre 25 y 65 en una distribucin normal.
357
Frecuencias
Amplitud. Diferencia entre los valores mayor y menor de una variable numrica;
simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una
asimetra positiva significativa tiene una cola derecha larga. Una distribucin que
tenga una asimetra negativa significativa tiene una cola izquierda larga. Como
regla aproximada, un valor de la asimetra mayor que el doble de su error tpico
se asume que indica una desviacin de la simetra.
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al
punto central. Para una distribucin normal, el valor del estadstico de curtosis
es 0. Una curtosis positiva indica que las observaciones se concentran ms y
presentan colas ms largas que las de una distribucin normal. Una curtosis
negativa indica que las observaciones se agrupan menos y presentan colas ms
cortas.
Los valores son puntos medios de grupos. Si los valores de los datos son puntos medios
de grupos (por ejemplo, si las edades de todas las personas entre treinta y cuarenta
aos se codifican como 35), seleccione esta opcin para estimar la mediana y los
percentiles para los datos originales no agrupados.
358
Captulo 14
Frecuencias: Grficos
Figura 14-4
Cuadro de dilogo Frecuencias: Grficos
todo. Cada sector de un grfico de este tipo corresponde a un grupo, definido por
una nica variable de agrupacin. Los grficos de barras muestran la frecuencia de
cada valor o categora distinta como una barra diferente, permitiendo comparar las
categoras de forma visual. Los histogramas tambin cuentan con barras, pero se
representan a lo largo de una escala de intervalos iguales. La altura de cada barra es el
recuento de los valores que estn dentro del intervalo para una variable cuantitativa.
Los histogramas muestran la forma, el centro y la dispersin de la distribucin.
Una curva normal superpuesta en un histograma ayuda a juzgar si los datos estn
normalmente distribuidos.
Valores del grfico. Para los grficos de barras, puede etiquetar el eje de escala con las
359
Frecuencias
Frecuencias: Formato
Figura 14-5
Cuadro de dilogo Frecuencias: Formato
Ordenar por. La tabla de frecuencias se puede organizar respecto a los valores actuales
de los datos o respecto al recuento (frecuencia de aparicin) de esos valores y la
tabla puede organizarse en orden ascendente o descendente. Sin embargo, si solicita
un histograma o percentiles, Frecuencias asumir que la variable es cuantitativa y
mostrar sus valores en orden ascendente.
Mltiples variables. Si desea generar tablas de estadsticos para mltiples variables,
podr mostrar todas las variables en una sola tabla (Comparar variables), o bien
mostrar una tabla de estadsticos independiente para cada variable (Organizar
resultados segn variables).
Suprimir tablas con ms de n categoras. Esta opcin impide que se muestren tablas
Captulo
15
Descriptivos
varianza, rango, suma, error tpico de la media, curtosis y asimetra con sus errores
tpicos.
Datos. Utilice variables numricas despus de haberlas inspeccionado grficamente
362
Captulo 15
de puntuaciones z tiene la misma forma que la de los datos originales; por tanto, el
clculo de puntuaciones z no es una solucin para los datos con problemas.
Para obtener estadsticos descriptivos
E Elija en los mens:
Analizar
Estadsticos descriptivos
Descriptivos...
Figura 15-1
Cuadro de dilogo Descriptivos
Si lo desea, puede:
363
Descriptivos
Descriptivos: Opciones
Figura 15-2
Cuadro de dilogo Descriptivos: Opciones
normal, el 68% de los casos se encuentra dentro de una desviacin tpica respecto
a la media y el 95% de los casos se encuentra dentro de dos desviaciones tpicas
respecto a la media. Por ejemplo, si la media de edad es 45, con una desviacin
tpica de 10, el 95% de los casos estara entre 25 y 65 en una distribucin normal.
Amplitud. Diferencia entre los valores mayor y menor de una variable numrica;
364
Captulo 15
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al
punto central. Para una distribucin normal, el valor del estadstico de curtosis
es 0. Una curtosis positiva indica que las observaciones se concentran ms y
presentan colas ms largas que las de una distribucin normal. Una curtosis
negativa indica que las observaciones se agrupan menos y presentan colas ms
cortas.
simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una
asimetra positiva significativa tiene una cola derecha larga. Una distribucin que
tenga una asimetra negativa significativa tiene una cola izquierda larga. Como
regla aproximada, un valor de la asimetra mayor que el doble de su error tpico
se asume que indica una desviacin de la simetra.
Orden de presentacin. Por defecto, las variables se muestran en el orden en que se
hayan seleccionado. Si lo desea, se pueden mostrar las variables alfabticamente, por
medias ascendentes o por medias descendentes.
365
Descriptivos
Excluir del anlisis casos con valores perdidos para cualquier variable (mediante
el subcomando MISSING).
Captulo
16
Explorar
368
Captulo 16
369
Explorar
V a lo re s extre m o s
N m e ro
d e ca so H o ra rio
V a lo r
H o ra M ayo re s 1
31
10 ,5
33
9 ,9
39
9 ,8
32
9 ,5
36
9 ,3
M e n o res 1
2 ,0
2 ,1
2 ,3
11
2 ,3
2 ,5
370
Captulo 16
Figura 16-2
Cuadro de dilogo Explorar
Si lo desea, puede:
371
Explorar
Explorar: Estadsticos
Figura 16-3
Cuadro de dilogo Explorar: Estadsticos
etiquetas de caso.
Percentiles. Muestra los valores de los percentiles 5, 10, 25, 50, 75, 90 y 95.
372
Captulo 16
Explorar: Grficos
Figura 16-4
Cuadro de dilogo Explorar: Grficos
caja cuando existe ms de una variable dependiente. Niveles de los factores juntos
genera una presentacin para cada variable dependiente. En cada una se muestran
diagramas de caja para cada uno de los grupos definidos por una variable de factor.
Dependientes juntas genera una presentacin para cada grupo definido por una
variable de factor. En cada una se muestran juntos los diagramas de caja de cada
variable dependiente. Esta disposicin es particularmente til cuando las variables
representan una misma caracterstica medida en momentos distintos.
Descriptivos. La seccin Descriptivos permite seleccionar grficos de tallo y hojas e
histogramas.
Grficos con pruebas de normalidad. Muestra los diagramas de probabilidad normal y
de probabilidad sin tendencia. Se muestra el estadstico de Kolmogorov-Smirnov con
un nivel de significacin de Lilliefors para contrastar la normalidad. Si se especifican
ponderaciones no enteras, se calcular el estadstico de Shapiro-Wilk cuando el
tamao de la muestra ponderada est entre 3 y 50. Si no hay ponderaciones o stas
son enteras, se calcular el estadstico cuando el tamao muestral est entre 3 y 5000.
373
Explorar
Dispersin por nivel con prueba de Levene. Controla la transformacin de los datos
para los diagramas de dispersin por nivel. Para todos los diagramas de dispersin por
nivel se muestra la pendiente de la lnea de regresin y las pruebas robustas de Levene
sobre la homogeneidad de varianza. Si selecciona una transformacin, las pruebas de
Levene se basarn en los datos transformados. Si no selecciona ninguna variable de
factor, no se generar ningn diagrama de dispersin por nivel. Estimacin de potencia
produce un grfico de los logaritmos naturales de las amplitudes intercuartiles
respecto a los logaritmos naturales de las medianas de todas las casillas, as como
una estimacin de la transformacin de potencia necesaria para conseguir varianzas
iguales en las casillas. Un diagrama de dispersin por nivel ayuda a determinar la
potencia que precisa una transformacin para estabilizar (igualar) las varianzas de los
grupos. Transformados permite seleccionar una de las alternativas de potencia, quizs
siguiendo las recomendaciones de la estimacin de potencia, y genera grficos de
los datos transformados. Se trazan la amplitud intercuartil y la mediana de los datos
transformados. No transformados genera grficos de los datos brutos. Es equivalente a
una transformacin con una potencia de 1.
1/raz cuadrada. Para cada valor de los datos se calcula el inverso de la raz
cuadrada.
374
Captulo 16
Explorar: Opciones
Figura 16-5
Cuadro de dilogo Explorar: Opciones
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable
Excluir casos segn pareja. Los casos que no tengan valores perdidos para las
Mostrar los valores. Los valores perdidos para las variables de factor se tratan
como una categora diferente. Todos los resultados se generan para esta categora
adicional. Las tablas de frecuencias incluyen categoras para los valores perdidos.
Los valores perdidos para una variable de factor se incluyen pero se etiquetan
como perdidos.
Solicitar los grficos y resultados totales adems de los grficos y los resultados
para los grupos definidos por las variables de factor (con el subcomando TOTAL).
375
Explorar
Captulo
Tablas de contingencia
17
377
378
Captulo 17
Datos. Para definir las categoras de cada variable, utilice valores de una variable
numrica o de cadena corta (ocho caracteres o menos). Por ejemplo, para sexo, podra
codificar los datos como 1 y 2 o como varn y mujer.
Supuestos. En algunos estadsticos y medidas se asume que hay unas categoras
ordenadas (datos ordinales) o unos valores cuantitativos (datos de intervalos o de
proporciones), como se explica en la seccin sobre los estadsticos. Otros estadsticos
son vlidos cuando las variables de la tabla tienen categoras no ordenadas (datos
nominales). Para los estadsticos basados en chi-cuadrado (phi, V de Cramr y
coeficiente de contingencia), los datos deben ser una muestra aleatoria de una
distribucin multinomial.
Nota: Las variables ordinales pueden ser cdigos numricos que representen
categoras (por ejemplo, 1 = bajo, 2 = medio, 3 = alto) o valores de cadena. Sin
embargo, se supone que el orden alfabtico de los valores de cadena indica el orden
correcto de las categoras. Por ejemplo, en una variable de cadena cuyos valores sean
bajo, medio, alto, se interpreta el orden de las categoras como alto, bajo, medio
(orden que no es el correcto). Por norma general, se puede indicar que es ms fiable
utilizar cdigos numricos para representar datos ordinales.
Figura 17-1
Resultados de las tablas de contingencia
379
Tablas de contingencia
Si lo desea, puede:
380
Captulo 17
381
Tablas de contingencia
Chi-cuadrado. Para las tablas con dos filas y dos columnas, seleccione Chi-cuadrado
382
Captulo 17
proporcional del error cuando los valores de una variable se emplean para
pronosticar valores de la otra variable. Por ejemplo, un valor de 0.83 indica
que el conocimiento de una variable reduce en un 83% el error al pronosticar
los valores de la otra variable. SPSS calcula tanto la versin simtrica como la
asimtrica del coeficiente de incertidumbre.
Ordinal. Para las tablas en las que tanto las filas como las columnas contienen valores
que ignora los empates. El signo del coeficiente indica la direccin de la relacin
y su valor absoluto indica la magnitud de la misma, de tal modo que los mayores
383
Tablas de contingencia
valor 0 indica que no hay asociacin entre las variables de fila y de columna. Los
valores cercanos a 1 indican que hay gran relacin entre las variables. Eta resulta
apropiada para una variable dependiente medida en una escala de intervalo (por
ejemplo, ingresos) y una variable independiente con un nmero limitado de
categoras (por ejemplo, gnero). Se calculan dos valores de eta: uno trata la
variable de las filas como una variable de intervalo; el otro trata la variable de las
columnas como una variable de intervalo.
Kappa. La kappa de Cohen mide el acuerdo entre las evaluaciones de dos jueces
cuando ambos estn valorando el mismo objeto. Un valor igual a 1 indica un acuerdo
perfecto. Un valor igual a 0 indica que el acuerdo no es mejor que el que se obtendra
por azar. Kappa slo est disponible para las tablas cuadradas (tablas en las que
ambas variables tienen el mismo nmero de categoras).
Riesgo. Pata tablas 2x2, una medida del grado de asociacin entre la presencia de un
factor y la ocurrencia de un evento. Si el intervalo de confianza para el estadstico
incluye un valor de 1, no se podr asumir que el factor est asociado con el evento.
Cuando la ocurrencia del factor es rara, se puede utilizar la razn de las ventajas (odds
ratio) como estimacin del riesgo relativo.
McNemar. Prueba no paramtrica para dos variables dicotmicas relacionadas.
384
Captulo 17
Para ayudarle a descubrir las tramas en los datos que contribuyen a una prueba de
chi-cuadrado significativa, el procedimiento Tablas de contingencia muestra las
frecuencias esperadas y tres tipos de residuos (desviaciones) que miden la diferencia
entre las frecuencias observadas y las esperadas. Cada casilla de la tabla puede
contener cualquier combinacin de recuentos, porcentajes y residuos seleccionados.
Recuentos. El nmero de casos realmente observados y el nmero de casos esperados
si las variables de fila y columna son independientes entre s.
Porcentajes. Los porcentajes se pueden sumar a travs de las filas o a lo largo de las
385
Tablas de contingencia
residuos tipificados, que son conocidos tambin como los residuos de Pearson o
residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
tal cual, pero las ponderaciones acumuladas en las casillas se redondean antes de
calcular cualquiera de los estadsticos.
tal cual, pero las ponderaciones acumuladas en las casillas se truncan antes de
calcular cualquiera de los estadsticos.
Truncar las ponderacines de los casos. Se truncan las ponderaciones de los casos
antes de utilizarlas.
Sin ajustes. Las ponderaciones de los casos se utilizan tal cual y se utilizan las
386
Captulo 17
Captulo
Resmenes de casos
18
387
388
Captulo 18
Figura 18-1
Resultados del procedimiento Resmenes de casos
389
Resmenes de casos
E Seleccione una o ms variables.
Si lo desea, puede:
Pulsar en Opciones para cambiar el ttulo de los resultados, aadir un texto al pie
debajo de los resultados o excluir los casos con valores perdidos.
Seleccionar Mostrar los casos para listar los casos en cada subgrupo. Por defecto,
el sistema enumera slo los 100 primeros casos del archivo. Puede aumentar o
disminuir el valor de Limitar los casos a los primeros n o desactivar ese elemento
para enumerar todos los casos.
Resumir: Opciones
Figura 18-3
Cuadro de dilogo Resmenes de casos: Opciones
Resumir permite cambiar el ttulo de los resultados o aadir un texto que aparecer
debajo de la tabla de resultados. Puede controlar el ajuste de las lneas en los ttulos y
textos escribiendo \n en el lugar donde desee insertar una lnea de separacin.
Adems, puede elegir entre mostrar o suprimir los subttulos para los totales e
incluir o excluir los casos con valores perdidos para cualquiera de las variables
utilizadas en cualquiera de los anlisis. A menudo es aconsejable representar los
casos perdidos en los resultados con un punto o un asterisco. Introduzca un carcter,
frase o cdigo que desee que aparezca cuando haya un valor perdido; de lo contrario,
no se aplicar ningn tratamiento especial a los casos perdidos en los resultados.
390
Captulo 18
Resumir: Estadsticos
Figura 18-4
Cuadro de dilogo Resumir los casos: Estadsticos
Puede elegir uno o ms de los siguientes estadsticos de subgrupo para las variables
dentro de cada categora de cada variable de agrupacin: suma, nmero de casos,
media, mediana, mediana agrupada, error tpico de la media, mnimo, mximo,
rango, valor de la variable para la primera categora de la variable de agrupacin,
valor de la variable para la ltima categora de la variable de agrupacin, desviacin
tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra,
porcentaje de la suma total, porcentaje del N total, porcentaje de la suma en,
porcentaje de N en, media geomtrica y media armnica. El orden en el que aparecen
los estadsticos en la lista Estadsticos de casilla es el orden en el que se mostrarn
en los resultados. Tambin se muestran estadsticos de resumen para cada variable a
travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos.
Media geomtrica. La raz ensima del producto de los valores de los datos, donde n
Por ejemplo, para los datos de edades, si cada valor de una treintena se codifica como
35, cada valor de una cuarentena se codifica como 45 y as sucesivamente, la mediana
agrupada es la mediana calculada a partir de los datos codificados.
391
Resmenes de casos
central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una
curtosis positiva indica que las observaciones se concentran ms y presentan colas
ms largas que las de una distribucin normal. Una curtosis negativa indica que las
observaciones se agrupan menos y presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos.
Mximo. El mayor valor de una variable numrica.
Media. Una medida de tendencia central. El promedio aritmtico; la suma dividida
simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una
asimetra positiva significativa tiene una cola derecha larga. Una distribucin que
tenga una asimetra negativa significativa tiene una cola izquierda larga. Como regla
aproximada, un valor de la asimetra mayor que el doble de su error tpico se asume
que indica una desviacin de la simetra.
392
Captulo 18
Error tpico de la curtosis. La razn de la curtosis sobre su error tpico puede utilizarse
como contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn
es menor que -2 o mayor que +2). Un valor grande y positivo para la curtosis indica
que las colas son ms largas que las de una distribucin normal; por el contrario, un
valor extremo y negativo indica que las colas son ms cortas (llegando a tener forma
de caja como en la distribucin uniforme).
Error tpico de la asimetra. La razn de la asimetra sobre su error tpico puede
utilizarse como un contraste de la normalidad (es decir, se puede rechazar la
normalidad si la razn es menor que -2 o mayor que +2). Un valor grande y positivo
para la asimetra indica una cola larga a la derecha; un valor extremo y negativo
indica una cola larga por la izquierda.
Suma. La suma o total de todos los valores, a lo largo de todos los casos que no
Captulo
19
Medias
394
Captulo 19
Figura 19-1
Resultados del procedimiento Medias
Informe
Gramos de grasa absorbida
De Cacahuete
Media
N
Manteca
Desv. tp.
13.34
Media
85.00
Desv. tp.
De Maz
Media
N
7.77
62.00
6
Desv. tp.
Total
72.00
Media
N
8.22
73.00
18
Desv. tp.
13.56
Tabla de ANOVA
Gramos de grasa
absorbida * Tipo
de aceite
Inter-grupos
(Combinadas)
Suma de
cuadrados
1596.000
Media
cuadrtica
798.000
102.000
gl
Intra-grupos
1530.000
15
Total
3126.000
17
F
7.824
Sig.
.005
395
Medias
Figura 19-2
Cuadro de dilogo Medias
categricas:
396
Captulo 19
Medias: Opciones
Figura 19-3
Cuadro de dilogo Medias: Opciones
Puede elegir uno o ms de los siguientes estadsticos de subgrupo para las variables
dentro de cada categora de cada variable de agrupacin: suma, nmero de casos,
media, mediana, mediana agrupada, error tpico de la media, mnimo, mximo,
rango, valor de la variable para la primera categora de la variable de agrupacin,
valor de la variable para la ltima categora de la variable de agrupacin, desviacin
tpica, varianza, curtosis, error tpico de curtosis, asimetra, error tpico de asimetra,
porcentaje de la suma total, porcentaje del N total, porcentaje de la suma en,
porcentaje de N en, media geomtrica, media armnica. Se puede cambiar el orden
de aparicin de los estadsticos de subgrupo. El orden en el que aparecen en la lista
Estadsticos de casilla es el mismo orden que presentarn en los resultados. Tambin
se muestran estadsticos de resumen para cada variable a travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos.
Media geomtrica. La raz ensima del producto de los valores de los datos, donde n
representa el nmero de casos.
397
Medias
Mediana agrupada. La mediana calculada para los datos que se codifican en grupos.
Por ejemplo, para los datos de edades, si cada valor de una treintena se codifica como
35, cada valor de una cuarentena se codifica como 45 y as sucesivamente, la mediana
agrupada es la mediana calculada a partir de los datos codificados.
Media armnica. Se utiliza para estimar el tamao promedio de un grupo cuando
los tamaos de las muestras de los grupos no son iguales. La media armnica es el
nmero total de muestras divido por la suma de los inversos de los tamaos de las
muestras.
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto
central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una
curtosis positiva indica que las observaciones se concentran ms y presentan colas
ms largas que las de una distribucin normal. Una curtosis negativa indica que las
observaciones se agrupan menos y presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos.
Mximo. El mayor valor de una variable numrica.
Media. Una medida de tendencia central. El promedio aritmtico; la suma dividida
por el nmero de casos.
Mediana. Valor por encima y por debajo del cual se encuentran la mitad de los
398
Captulo 19
tenga una asimetra negativa significativa tiene una cola izquierda larga. Como regla
aproximada, un valor de la asimetra mayor que el doble de su error tpico se asume
que indica una desviacin de la simetra.
Error tpico de la curtosis. La razn de la curtosis sobre su error tpico puede utilizarse
como contaste de la normalidad (es decir, se puede rechazar la normalidad si la razn
es menor que -2 o mayor que +2). Un valor grande y positivo para la curtosis indica
que las colas son ms largas que las de una distribucin normal; por el contrario, un
valor extremo y negativo indica que las colas son ms cortas (llegando a tener forma
de caja como en la distribucin uniforme).
Error tpico de la asimetra. La razn de la asimetra sobre su error tpico puede
utilizarse como un contraste de la normalidad (es decir, se puede rechazar la
normalidad si la razn es menor que -2 o mayor que +2). Un valor grande y positivo
para la asimetra indica una cola larga a la derecha; un valor extremo y negativo
indica una cola larga por la izquierda.
Suma. La suma o total de todos los valores, a lo largo de todos los casos que no
media cuadrtica asociados con los componentes lineal y no lineal, as como la razn
F, la R y la R cuadrado. Si la variable independiente es una cadena corta entonces la
linealidad no se calcula.
Captulo
20
Cubos OLAP
una escala de intervalo o de razn) y las variables de agrupacin son categricas. Los
valores de las variables categricas pueden ser numricos o de cadena corta.
Supuestos. Algunos de los estadsticos opcionales de subgrupo, como la media y
399
400
Captulo 20
Figura 20-1
Resultado de cubos OLAP
401
Cubos OLAP
Figura 20-2
Cuadro de dilogo Cubos OLAP
Calcule las diferencias existentes entre los pares de variables y los pares de grupos
definidos por una variable de agrupacin (pulse en Diferencias).
402
Captulo 20
Puede elegir uno o varios de los siguientes estadsticos de subgrupo para las variables
de resumen dentro de cada categora de cada variable de agrupacin: Suma, Nmero
de casos, Media, Mediana, Mediana agrupada, Error tpico de la media, Mnimo,
Mximo, Rango, Valor de la variable para la primera categora de la variable de
agrupacin, Valor de la variable para la ltima categora de la variable de agrupacin,
Desviacin tpica, Varianza, Curtosis, Error tpico de curtosis, Asimetra, Error tpico
de asimetra, Porcentaje de casos totales, Porcentaje de la suma total, Porcentaje de
casos totales dentro de las variables de agrupacin, Porcentaje de la suma total dentro
de las variables de agrupacin, Media geomtrica y Media armnica.
Se puede cambiar el orden de aparicin de los estadsticos de subgrupo. El orden
en el que aparecen en la lista Estadsticos de casilla es el mismo orden que presentarn
en los resultados. Tambin se muestran estadsticos de resumen para cada variable a
travs de todas las categoras.
Primero. Muestra el primer valor de los datos encontrado en el archivo de datos.
Media geomtrica. La raz ensima del producto de los valores de los datos, donde n
403
Cubos OLAP
Mediana agrupada. La mediana calculada para los datos que se codifican en grupos.
Por ejemplo, para los datos de edades, si cada valor de una treintena se codifica como
35, cada valor de una cuarentena se codifica como 45 y as sucesivamente, la mediana
agrupada es la mediana calculada a partir de los datos codificados.
Media armnica. Se utiliza para estimar el tamao promedio de un grupo cuando
los tamaos de las muestras de los grupos no son iguales. La media armnica es el
nmero total de muestras divido por la suma de los inversos de los tamaos de las
muestras.
Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto
central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una
curtosis positiva indica que las observaciones se concentran ms y presentan colas
ms largas que las de una distribucin normal. Una curtosis negativa indica que las
observaciones se agrupan menos y presentan colas ms cortas.
ltimo. Muestra el ltimo valor de los datos encontrado en el archivo de datos.
Mximo. El mayor valor de una variable numrica.
Media. Una medida de tendencia central. El promedio aritmtico; la suma dividida
por el nmero de casos.
Mediana. Valor por encima y por debajo del cual se encuentran la mitad de los
404
Captulo 20
405
Cubos OLAP
por una variable de agrupacin. Los valores de los estadsticos de resumen para
la segunda categora de cada par (la variable Menos) se restan de los valores de
406
Captulo 20
Puede cambiar el ttulo de los resultados o aadir un texto al pie que aparecer
debajo de la tabla de resultados. Tambin puede controlar el ajuste de las lneas
de los ttulos y de los textos al pie escribiendo \n en el lugar del texto donde desee
insertar una lnea de separacin.
Captulo
21
Pruebas T
Hay tres tipos de pruebas t:
Prueba T para muestras independientes (prueba T para dos muestras). Compara las
medias de una variable para dos grupos de casos. Se ofrecen estadsticos descriptivos
para cada grupo y la prueba de Levene sobre la igualdad de las varianzas, as como
valores t de igualdad de varianzas y varianzas desiguales y un intervalo de confianza
al 95% para la diferencia entre las medias.
Prueba T para muestras relacionadas (prueba T dependiente). Compara las medias de
dos variables en un solo grupo. Esta prueba tambin se utiliza para pares relacionados
o diseos de estudio de control de casos. El resultado incluye estadsticos descriptivos
de las variables que se van a contrastar, la correlacin entre ellas, estadsticos
descriptivos de las diferencias emparejadas, la prueba t y un intervalo de confianza al
95%.
Prueba t para una muestra. Compara la media de una variable con un valor conocido
408
Captulo 21
entre las medias. Las diferencias de ingresos medios pueden estar sometidas a la
influencia de factores como los estudios (y no solamente el sexo).
Ejemplo. Se asigna aleatoriamente un grupo de pacientes con hipertensin arterial a
un grupo con placebo y otro con tratamiento. Los sujetos con placebo reciben una
pastilla inactiva y los sujetos con tratamiento reciben un nuevo medicamento del cual
se espera que reduzca la tensin arterial. Despus de tratar a los sujetos durante dos
meses, se utiliza la prueba t para dos muestras para comparar la tensin arterial media
del grupo con placebo y del grupo con tratamiento. Cada paciente se mide una sola
vez y pertenece a un solo grupo.
Estadsticos. Para cada variable: tamao muestral, media, desviacin tpica y error
tpico de la media. Para la diferencia entre las medias: media, error tpico e intervalo
de confianza (puede especificar el nivel de confianza). Pruebas: prueba de Levene
sobre la igualdad de varianzas y pruebas t de varianzas combinadas y separadas sobre
la igualdad de las medias.
Datos. Los valores de la variable cuantitativa de inters se hallan en una nica
409
Pruebas T
410
Captulo 21
Para las variables de agrupacin numricas, defina los dos grupos de la prueba t
especificando dos valores o un punto de corte:
Usar valores especificados. Escriba un valor para el Grupo 1 y otro para el Grupo
2. Los casos con otros valores quedarn excluidos del anlisis. Los nmeros no
tienen que ser enteros (por ejemplo, 6,25 y 12,5 son vlidos).
agrupacin en dos conjuntos. Todos los casos con valores menores que el punto
de corte forman un grupo y los casos con valores mayores o iguales que el punto
de corte forman el otro grupo.
Figura 21-4
Cuadro de dilogo Definir grupos para variables de cadena
Para las variables de agrupacin de cadena corta, escriba una cadena para el Grupo 1
y otra para el Grupo 2; por ejemplo s y no. Los casos con otras cadenas se excluyen
del anlisis.
411
Pruebas T
la diferencia entre las medias. Introduzca un valor entre 1 y 99 para solicitar otro
nivel de confianza.
Valores perdidos. Si ha probado varias variables y se han perdido los datos de una o
Excluir casos segn anlisis. Cada prueba t utiliza todos los casos que tienen datos
vlidos para las variables contrastadas. Los tamaos muestrales pueden variar
de una prueba a otra.
Excluir casos segn lista. Cada prueba t utiliza slo aquellos casos que contienen
datos vlidos para todas las variables utilizadas en las pruebas t solicitadas. El
tamao muestral es constante en todas las pruebas.
pacientes al comienzo del estudio, se les aplica un tratamiento y se les toma la tensin
otra vez. De esta manera, a cada paciente le corresponden dos medidas, normalmente
denominadas medidas pre y post. Un diseo alternativo para el que se utiliza esta
prueba consiste en un estudio de pares relacionados o un estudio de control de casos
en el que cada registro en el archivo de datos contiene la respuesta del paciente y
de su sujeto de control correspondiente. En un estudio sobre la tensin sangunea,
pueden emparejarse pacientes y controles por edad (un paciente de 75 aos con un
miembro del grupo de control de 75 aos).
412
Captulo 21
Estadsticos. Para cada variable: media, tamao muestral, desviacin tpica y error
Diferencias relacionadas
Media
Par 1
Antes del
tratamiento
- Despus
del
tratamiento
26.10
Desviacin
tp.
Error tp.
de la
media
19.59
6.19
Intervalo de
confianza para
la diferencia
Inferior
12.09
4.214
Sig.
(bilateral)
gl
.002
413
Pruebas T
414
Captulo 21
la diferencia entre las medias. Introduzca un valor entre 1 y 99 para solicitar otro
nivel de confianza.
Valores perdidos. Si ha probado varias variables y se han perdido los datos de una o
Excluir casos segn anlisis. Cada prueba t utilizar todos los casos que contienen
Excluir casos segn lista. Cada prueba t utilizar nicamente los casos que
415
Pruebas T
Datos. Para contrastar los valores de una variable cuantitativa con un valor de
contraste hipotetizado, elija una variable cuantitativa e introduzca un valor de
contraste hipotetizado.
Supuestos. Esta prueba asume que los datos estn normalmente distribuidos; sin
embargo, esta prueba es bastante robusto frente a las desviaciones de la normalidad.
Figura 21-9
Resultados de Prueba T para una muestra
416
Captulo 21
Figura 21-10
Cuadro de dilogo Prueba T para una muestra
417
Pruebas T
Excluir casos segn anlisis. Cada prueba t utiliza todos los casos que tienen
datos vlidos para la variable contrastada. Los tamaos muestrales pueden variar
de una prueba a otra.
Excluir casos segn lista. Cada prueba t utiliza slo aquellos casos que contienen
datos vlidos para todas las variables utilizadas en las pruebas t solicitadas. El
tamao muestral es constante en todas las pruebas.
Contrastar una variable con todas las variables de una lista, en una prueba
relacionada (mediante el subcomando PAIRS).
Captulo
ANOVA de un factor
22
419
420
Captulo 22
Descriptivos
Intervalo de confianza
para la media al 95%
N
Gramos
de grasa
absorbida
Tipo
de
aceite
Media
Desviacin
tpica
Lmite
inferior
Mximo
86.00
56
95
93.16
77
97
53.37
70.63
49
70
66.26
79.74
49
97
72.00
13.34
5.45
58.00
Manteca
85.00
7.77
3.17
76.84
De Maz
62.00
8.22
3.36
18
73.00
13.56
3.20
Coeficientes de contraste
Tipo de aceite
De
Cacahuete
-.5
Manteca
1
De Maz
-.5
Lmite
superior
Mnimo
De
Cacahuete
Total
Contraste
1
Error
tpico
421
ANOVA de un factor
Pruebas de contraste
Gramos de
grasa absorbida
Contraste
1
Valor de
contraste
18.00
Error
tpico
5.05
t
3.565
gl
15
Sig.
(bilateral)
.003
18.00
4.51
3.995
12.542
.002
422
Captulo 22
423
ANOVA de un factor
aplicaciones, la suma de los coeficientes debera ser 0. Los conjuntos que no sumen 0
tambin se pueden utilizar, pero aparecer un mensaje de advertencia.
Una vez que se ha determinado que existen diferencias entre las medias, las pruebas
de rango post hoc y las comparaciones mltiples por parejas permiten determinar
qu medias difieren. Las pruebas de rango identifican subconjuntos homogneos
de medias que no se diferencian entre s. Las comparaciones mltiples por parejas
contrastan la diferencia entre cada pareja de medias y dan lugar a una matriz donde
los asteriscos indican las medias de grupo significativamente diferentes a un nivel
alfa de 0,05.
Asumiendo varianzas iguales
424
Captulo 22
LSD. Utiliza pruebas t para llevar a cabo todas las comparaciones por pares entre
Bonferroni. Utiliza las pruebas de t para realizar comparaciones por pares entre las
medias de los grupos, pero controla la tasa de error global estableciendo que la
tasa de error de cada prueba sea igual a la tasa de error por experimento dividida
entre el nmero total de contrastes. As, se corrige el nivel crtico por el hecho
de que se estn realizando mltiples comparaciones.
Scheff. Realiza comparaciones mltiples conjuntas por parejas para todas las
S-N-K. Realiza todas las comparaciones por parejas entre las medias utilizando
Tukey. Utiliza el estadstico del rango estudentizado para realizar todas las
comparaciones por pares entre los grupos. Establece la tasa de error por
experimento como la tasa de error para el conjunto de todas las comparaciones
por pares.
Tukey-b. Prueba que emplea la distribucin del rango estudentizado para realizar
comparaciones por pares entre los grupos. El valor crtico es el promedio de los
valores correspondientes a la diferencia honestamente significativa de Tukey y al
mtodo de Student-Newman-Keuls.
Duncan. Realiza comparaciones por pares utilizando un orden por pasos idntico
425
ANOVA de un factor
de usar una tasa de error para los contrastes individuales. Utiliza el estadstico
del rango estudentizado.
426
Captulo 22
427
ANOVA de un factor
Excluir casos segn anlisis. Un caso que tenga un valor perdido para la variable
Excluir casos segn lista. Se excluyen de todos los anlisis los casos con valores
Captulo
23
429
430
Captulo 23
431
MLG Anlisis univariante
Figura 23-1
Resultados de MLG Univariante
432
Captulo 23
Figura 23-2
Cuadro de dilogo Univariante
de los datos.
E Si lo desea, puede utilizar la Ponderacin MCP para especificar una variable de
433
MLG Anlisis univariante
MLG: Modelo
Figura 23-3
Cuadro de dilogo Univariante: Modelo
434
Captulo 23
Construir trminos
Para las covariables y los factores seleccionados:
Interaccin. Crea el trmino de interaccin de mayor nivel con todas las variables
seleccionada.
Todas de 2. Crea todas las interacciones dobles posibles de las variables seleccionadas.
Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas.
Todas de 4. Crea todas las interacciones cudruples posibles de las variables
seleccionadas.
Todas de 5. Crea todas las interacciones quntuples posibles de las variables
seleccionadas.
Suma de cuadrados
Para el modelo, puede elegir un tipo de suma de cuadrados. El Tipo III es el ms
utilizado y es el tipo por defecto.
Tipo I. Este mtodo tambin se conoce como el mtodo de descomposicin jerrquica
435
MLG Anlisis univariante
Tipo II. Este mtodo calcula cada suma de cuadrados del modelo considerando slo
los efectos pertinentes. Un efecto pertinente es el que corresponde a todos los efectos
que no contienen el que se est examinando. El mtodo Tipo II para la obtencin de
sumas de cuadrados se utiliza normalmente para:
Tipo III. Es el mtodo por defecto. Este mtodo calcula las sumas de cuadrados de
un efecto del diseo como las sumas de cuadrados corregidas respecto a cualquier
otro efecto que no lo contenga y ortogonales a cualquier efecto (si existe) que lo
contenga. Las sumas de cuadrados de Tipo III tienen una gran ventaja por ser
invariables respecto a las frecuencias de casilla, siempre que la forma general de
estimabilidad permanezca constante. As, este tipo de sumas de cuadrados se suele
considerar de gran utilidad para un modelo no equilibrado sin casillas perdidas. En un
diseo factorial sin casillas perdidas, este mtodo equivale a la tcnica de cuadrados
ponderados de las medias de Yates. El mtodo Tipo III para la obtencin de sumas de
cuadrados se utiliza normalmente para:
Tipo IV. Este mtodo est diseado para una situacin en la que hay casillas perdidas.
Para cualquier efecto F en el diseo, si F no est contenida en cualquier otro efecto,
entonces Tipo IV = Tipo III = Tipo II. Cuando F est contenida en otros efectos, el
Tipo IV distribuye equitativamente los contrastes que se realizan entre los parmetros
en F a todos los efectos de nivel superior. El mtodo Tipo IV para la obtencin de
sumas de cuadrados se utiliza normalmente para:
436
Captulo 23
MLG: Contrastes
Figura 23-4
Cuadro de dilogo Univariante: Contrastes
Los contrastes se utilizan para contrastar las diferencias entre los niveles de un
factor. Puede especificar un contraste para cada factor en el modelo (en un modelo
de medidas repetidas, para cada factor inter-sujetos). Los contrastes representan las
combinaciones lineales de los parmetros.
El contraste de hiptesis se basa en la hiptesis nula LB = 0, donde L es la matriz
de coeficientes de contraste y B es el vector de parmetros. Cuando se especifica
un contraste, SPSS crea una matriz L en la que las columnas correspondientes al
factor coinciden con el contraste. El resto de las columnas se corrigen para que la
matriz L sea estimable.
Los resultados incluyen un estadstico F para cada conjunto de contrastes. Para el
contraste de diferencias tambin se muestran los intervalos de confianza simultneos
de tipo Bonferroni basados en la distribucin t de Student.
Contrastes disponibles
Tipos de contrastes
Desviacin. Compara la media de cada nivel (excepto una categora de referencia)
con la media de todos los niveles (media global). Los niveles del factor pueden
colocarse en cualquier orden.
437
MLG Anlisis univariante
Simple. Compara la media de cada nivel con la media de un nivel especificado. Este
tipo de contraste resulta til cuando existe un grupo de control. Puede seleccionar la
primera o la ltima categora como referencia.
Diferencia. Compara la media de cada nivel (excepto el primero) con la media de los
libertad contiene el efecto lineal a travs de todas las categoras; el segundo grado
de libertad, el efecto cuadrtico, y as sucesivamente. Estos contrastes se utilizan a
menudo para estimar las tendencias polinmicas.
Los grficos de perfil (grficos de interaccin) sirven para comparar las medias
marginales en el modelo. Un grfico de perfil es un grfico de lneas en el que cada
punto indica la media marginal estimada de una variable dependiente (corregida
respecto a las covariables) en un nivel de un factor. Los niveles de un segundo factor
438
Captulo 23
se pueden utilizar para generar lneas diferentes. Cada nivel en un tercer factor se
puede utilizar para crear un grfico diferente. Todos los factores fijos y aleatorios,
si existen, estn disponibles para los grficos. Para los anlisis multivariantes, los
grficos de perfil se crean para cada variable dependiente. En un anlisis de medidas
repetidas, es posible utilizar tanto los factores inter-sujetos como los intra-sujetos en
los grficos de perfil. Las opciones MLG - Multivariante y MLG - Medidas repetidas
slo estarn disponibles si tiene instalada la opcin Modelos avanzados.
Un grfico de perfil de un factor muestra si las medias marginales estimadas
aumentan o disminuyen a travs de los niveles. Para dos o ms factores, las lneas
paralelas indican que no existe interaccin entre los factores, lo que significa que
puede investigar los niveles de un nico factor. Las lneas no paralelas indican una
interaccin.
Figura 23-6
Grfico no paralelo (izquierda) y grfico paralelo (derecha)
439
MLG Anlisis univariante
Pruebas de comparaciones mltiples post hoc Una vez que se ha determinado que
existen diferencias entre las medias, las pruebas de rango post hoc y las comparaciones
mltiples por parejas permiten determinar qu medias difieren. Las comparaciones se
realizan sobre valores sin corregir. Estas pruebas se utilizan nicamente para factores
inter-sujetos fijos. En MLG Medidas repetidas, estas pruebas no estn disponibles si
no existen factores inter-sujetos y las pruebas de comparacin mltiple post hoc se
realizan para la media a travs de los niveles de los factores intra-sujetos. Para MLG
- Multivariante, las pruebas post hoc se realizan por separado para cada variable
dependiente. Las opciones MLG - Multivariante y MLG - Medidas repetidas slo
estarn disponibles si tiene instalada la opcin Modelos avanzados.
Las pruebas de diferencia honestamente significativa de Tukey y de Bonferroni
son pruebas de comparacin mltiple muy utilizadas. La prueba de Bonferroni,
basada en el estadstico t de Student, corrige el nivel de significacin observado
por el hecho de que se realizan comparaciones mltiples. La prueba t de Sidak
tambin corrige el nivel de significacin y da lugar a lmites ms estrechos que los de
Bonferroni. La prueba de diferencia honestamente significativa de Tukey utiliza
el estadstico del rango estudentizado para realizar todas las comparaciones por pares
entre los grupos y establece la tasa de error por experimento como la tasa de error
440
Captulo 23
para el conjunto de todas las comparaciones por pares. Cuando se contrasta un gran
nmero de pares de medias, la prueba de la diferencia honestamente significativa de
Tukey es ms potente que la prueba de Bonferroni. Para un nmero reducido de
pares, Bonferroni es ms potente.
GT2 de Hochberg es similar a la prueba de la diferencia honestamente
significativa de Tukey, pero se utiliza el mdulo mximo estudentizado. La prueba de
Tukey suele ser ms potente. La prueba de comparacin por parejas de Gabriel
tambin utiliza el mdulo mximo estudentizado y es generalmente ms potente que
la GT2 de Hochberg cuando los tamaos de las casillas son desiguales. La prueba de
Gabriel se puede convertir en liberal cuando los tamaos de las casillas varan mucho.
La prueba t de comparacin mltiple por parejas de Dunnett compara un
conjunto de tratamientos con una media de control simple. La ltima categora es la
categora de control por defecto. Si lo desea, puede seleccionar la primera categora.
Asimismo, puede elegir una prueba unilateral o bilateral. Para comprobar que la
media de cualquier nivel del factor (excepto la categora de control) no es igual a la
de la categora de control, utilice una prueba bilateral. Para contrastar si la media en
cualquier nivel del factor es menor que la de la categora de control, seleccione <
Control. Asimismo, para contrastar si la media en cualquier nivel del factor es mayor
que la de la categora de control, seleccione > Control.
Ryan, Einot, Gabriel y Welsch (R-E-G-W) desarrollaron dos pruebas de rangos
mltiples por pasos. Los procedimientos mltiples por pasos (por tamao de las
distancias) contrastan en primer lugar si todas las medias son iguales. Si no son
iguales, se contrasta la igualdad en los subconjuntos de medias. R-E-G-W F se basa
en una prueba F y R-E-G-W Q se basa en un rango estudentizado. Estas pruebas son
ms potentes que la prueba de rangos mltiples de Duncan y Student-Newman-Keuls
(que tambin son procedimientos mltiples por pasos), pero no se recomiendan para
tamaos de casillas desiguales.
Cuando las varianzas son desiguales, utilice T2 de Tamhane (prueba conservadora
de comparacin por parejas basada en una prueba t), T3 de Dunnett (prueba de
comparacin por parejas basada en el mdulo mximo estudentizado), prueba de
comparacin por parejasGames-Howell (a veces liberal), o C de Dunnett (prueba
de comparacin por parejas basada en el rango estudentizado).
La prueba de rango mltiple de Duncan, Student-Newman-Keuls (S-N-K) y
b de Tukey son pruebas de rango que asignan rangos a medias de grupo y calculan
un valor de rango. Estas pruebas no se utilizan con la misma frecuencia que las
pruebas anteriormente mencionadas.
441
MLG Anlisis univariante
442
Captulo 23
MLG: Guardar
Figura 23-8
Cuadro de dilogo Univariante: Guardar
Es posible guardar los valores pronosticados por el modelo, los residuos y las medidas
relacionadas como variables nuevas en el Editor de datos. Muchas de estas variables
se pueden utilizar para examinar supuestos sobre los datos. Si desea almacenar los
valores para utilizarlos en otra sesin de SPSS, gurdelos en el archivo de datos actual.
Valores pronosticados. Son los valores que predice el modelo para cada caso.
dependiente para los casos que tengan los mismos valores en las variables
independientes.
Diagnsticos. Son medidas para identificar casos con combinaciones poco usuales
de valores para los casos y las variables independientes que puedan tener un gran
impacto en el modelo.
443
MLG Anlisis univariante
Distancia de Cook. Medida de cunto cambiaran los residuos de todos los casos si
modelo.
residuos tipificados, que son conocidos tambin como los residuos de Pearson o
residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
Eliminados. Residuo para un caso cuando ese caso se excluye del clculo de los
444
Captulo 23
Opciones MLG
Figura 23-9
Cuadro de dilogo Univariante: Opciones
corregidas entre las medias marginales estimadas para cualquier efecto principal
del modelo, tanto para los factores inter-sujetos como para los intra-sujetos.
Este elemento slo se encuentra disponible si los efectos principales estn
seleccionados en la lista Mostrar las medias para.
445
MLG Anlisis univariante
las pruebas post hoc y el nivel de confianza empleado para construir intervalos de
confianza. El valor especificado tambin se utiliza para calcular la potencia observada
para la prueba. Si especifica un nivel de significacin, el cuadro de dilogo mostrar
el nivel asociado de los intervalos de confianza.
446
Captulo 23
Construir una matriz L, una matriz M o una matriz K (utilizando los subcomandos
LMATRIX, MMATRIX y KMATRIX).
Captulo
Correlaciones bivariadas
24
448
Captulo 24
Figura 24-1
Resultados del procedimiento Correlaciones bivariadas
Correlaciones
Correlacin
de Pearson
Partidos ganados
Partidos
ganados
1.000
Sig. (bilateral)
Partidos ganados
.581**
-.401*
Puntos
Puntos en
obtenidos
contra por
por partido
partido
.581**
-.401*
1.000
.457*
.457*
1.000
.001
.038
.001
.017
.038
.017
Partidos ganados
27
27
27
27
27
27
27
27
27
449
Correlaciones bivariadas
E Seleccione dos o ms variables numricas.
450
Captulo 24
Estadsticos. Para las correlaciones de Pearson, se puede elegir una o ambas de estas
opciones:
muestra el nmero de casos que no tienen valores perdidos. Los valores perdidos
se consideran segn cada variable individual, sin tener en cuenta la opcin elegida
para la manipulacin de los valores perdidos.
Excluir casos segn pareja. Se excluyen del anlisis los casos con valores perdidos
Excluir casos segn lista. Se excluyen de todas las correlaciones los casos con
Escribir una matriz de correlaciones para correlaciones de Pearson que pueda ser
utilizada en lugar de los datos brutos, con el fin de obtener otros anlisis como
el anlisis factorial (con el subcomando MATRIX).
Obtener correlaciones de todas las variables de una lista con todas las variables
de una segunda lista (utilizando la palabra clave WITH en el subcomando
VARIABLES).
Captulo
Correlaciones parciales
25
tpica y media. Matrices de correlacin de orden cero y parcial, con grados de libertad
y niveles de significacin.
Datos. Utilice variables cuantitativas y simtricas.
Supuestos. El procedimiento Correlaciones parciales supone que cada par de variables
es normal bivariante.
451
452
Captulo 25
Figura 25-1
Resultados de las correlaciones parciales
- - -
P A R T I A L
C O R R E L A T I O N
C O E F F I C I E N T S
- - -
STERB_RT
LOG_BIP
GEB_RT
1.0000
(
0)
P= .
.3670
( 106)
P= .000
-.7674
( 106)
P= .000
STERB_RT
.3670
( 106)
P= .000
1.0000
(
0)
P= .
-.4015
( 106)
P= .000
LOG_BIP
-.7674
( 106)
P= .000
-.4015
( 106)
P= .000
1.0000
(
0)
P= .
- - -
P A R T I A L
Controlling for..
C O R R E L A T I O N
C O E F F I C I E N T S
LOG_BIP
GEB_RT
STERB_RT
GEB_RT
1.0000
(
0)
P= .
.1003
( 105)
P= .304
STERB_RT
.1003
( 105)
P= .304
1.0000
(
0)
P= .
- - -
453
Correlaciones parciales
E Seleccione dos o ms variables numricas para las que se van a calcular las
correlaciones parciales.
E Elija una o ms variables numricas de control.
454
Captulo 25
Excluir casos segn lista. Se excluyen de todos los clculos los casos que presenten
valores perdidos para cualquier variable, incluso si es para las variables de control.
Excluir casos segn pareja. Para el clculo de las correlaciones de orden cero,
455
Correlaciones parciales
Especificar otros valores para solicitar (por ejemplo, las correlaciones parciales
tanto de primer como de segundo orden) cuando tiene dos variables de control
(mediante el subcomando VARIABLES).
Captulo
26
Distancias
Este procedimiento calcula una variedad de estadsticos que miden las similitudes o
diferencias (distancias), entre pares de variables o entre pares de casos. Estas medidas
de similitud o distancia se pueden utilizar despus con otros procedimientos, como
anlisis factorial, anlisis de conglomerados o escalamiento multidimensional, para
ayudar en el anlisis de conjuntos de datos complejos.
Ejemplo. Es posible medir similaridades entre pares de automviles en funcin
de ciertas caractersticas, como tipo de motor, consumo y potencia? Al calcular
las similitudes entre los coches, se puede obtener una nocin de qu coches son
similares entre s y cules son diferentes. Para un anlisis ms formal, puede
considerar la aplicacin de un anlisis de conglomeracin jerrquico o escalamiento
multidimensional a las similitudes para explorar la estructura subyacente.
Estadsticos. Las medidas de diferencia (distancia) para datos de un intervalo son
Distancia eucldea, Distancia eucldea al cuadrado, Chebychev, bloque, Minkowski
o personalizada; para datos de recuento, medida de chi-cuadrado o phi-cuadrado;
para datos binarios, Distancia eucldea, Distancia eucldea al cuadrado, diferencia
de tamao, diferencia de configuracin, varianza, forma o Lance y Williams. Las
medidas de similitud para datos de intervalos son correlacin de Pearson o coseno;
para datos binarios, Russel y Rao, concordancia simple, Jaccard, Dice, Rogers y
Tanimoto, Sokal y Sneath 1, Sokal y Sneath 2, Sokal y Sneath 3, Kulczynski 1,
Kulczynski 2, Sokal y Sneath 4, Hamann, Lambda, D de Anderberg, Y de Yule, Q de
Yule, Ochiai, Sokal y Sneath 5, correlacin Phi de 4 puntos o dispersin.
Para obtener matrices de distancias
E Elija en los mens:
Analizar
Correlaciones
Distancias...
457
458
Captulo 26
Figura 26-1
Cuadro de dilogo Distancias
E Seleccione al menos una variable numrica para calcular distancias entre casos o
seleccione al menos dos variables numricas para calcular distancias entre variables.
E Seleccione una alternativa en el grupo Calcular distancias para calcular proximidades
459
Distancias
460
Captulo 26
461
Distancias
Especificar cualquier nmero entero como la potencia y la raz para una medida
de distancia personalizada.
Captulo
27
Regresin lineal
baloncesto en una temporada con la media de puntos que el equipo marca por
partido? Un diagrama de dispersin indica que estas variables estn relacionadas
linealmente. El nmero de partidos ganados y la media de puntos marcados por el
equipo adversario tambin estn relacionados linealmente. Estas variables tienen una
relacin negativa. A medida que el nmero de partidos ganados aumenta, la media
de puntos marcados por el equipo adversario disminuye. Con la regresin lineal es
posible modelar la relacin entre estas variables. Puede utilizarse un buen modelo
para predecir cuntos partidos ganarn los equipos.
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin
463
464
Captulo 27
Partidos ganados
50
40
30
20
10
90
100
110
120
Partidos ganados
50
40
30
20
10
80
90
100
110
120
465
Regresin lineal
Modelo
1
R
.9471
R
cuadrado
.898
R cuadrado
corregida
.889
Error tp. de
la
estimacin
4.40
ANOVA2
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
4080.533
Media
cuadrtica
2040.266
465.467
24
19.394
4546.000
26
gl
F
105.198
Sig.
.0001
1. Variables predictoras: (Constante), Puntos en contra por partido, Puntos obtenidos por
partido
2. Variable dependiente: Partidos ganados
Coeficientes1
Coeficientes no
estandarizados
Modelo
1
(Constante)
Puntos
obtenidos por
partido
Puntos en
contra por
partido
B
28.121
Error tp.
21.404
2.539
.193
-2.412
.211
Coeficientes
estandarizados
Beta
t
1.314
Sig.
.201
.965
13.145
.000
-.841
-11.458
.000
466
Captulo 27
467
Regresin lineal
E En el cuadro de dilogo Regresin lineal, seleccione una variable numrica
dependiente.
E Seleccione una ms variables numricas independientes.
Si lo desea, puede:
puntos de los datos se ponderan por los inversos de sus varianzas. Esto significa que
las observaciones con varianzas grandes tienen menor impacto en el anlisis que las
observaciones asociadas a varianzas pequeas.
468
Captulo 27
469
Regresin lineal
Los casos definidos por la regla de seleccin se incluyen en el anlisis. Por ejemplo,
si selecciona una variable, elija igual que y escriba 5 para el valor; de este modo,
solamente se incluirn en el anlisis los casos para los cuales la variable seleccionada
tenga un valor igual a 5. Tambin se permite un valor de cadena.
470
Captulo 27
otros valores diagnsticos, con los cuales podr poder crear grficos respecto a las
variables independientes. Se encuentran disponibles los siguientes grficos:
Diagramas de dispersin. Puede representar cualquier combinacin por parejas de la
471
Regresin lineal
Puede guardar los valores pronosticados, los residuos y otros estadsticos tiles para
los diagnsticos. Cada seleccin aade una o ms variables nuevas a su archivo de
datos activo.
Valores pronosticados. Son los valores que el modelo de regresin pronostica para
cada caso.
472
Captulo 27
E.T. del pronstico promedio. Error tpico de los valores pronosticados. Estimacin
valores para las variables independientes y casos que puedan tener un gran impacto
en el modelo.
473
Regresin lineal
modelo.
residuos tipificados, que son conocidos tambin como los residuos de Pearson o
residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
Eliminados. Residuo para un caso cuando ese caso se excluye del clculo de los
474
Captulo 27
absoluto sea mayor que 2 dividido por la raz cuadrada de p/N, donde p es el
nmero de variables independientes en la ecuacin y N es el nmero de casos.
475
Regresin lineal
para cada variable en el anlisis. Tambin muestra una matriz de correlaciones con el
nivel de significacin unilateral y el nmero de casos para cada correlacin.
Correlacin parcial. La correlacin que permanece entre dos variables despus de
eliminar la correlacin que es debida a su relacin mutua con las otras variables. La
correlacin entre la variable dependiente y una variable independiente cuando se
han eliminado de ambas los efectos lineales de las otras variables independientes
presentes en el modelo.
Correlacin semi-parcial (Regresin, Tabla pivote). La correlacin entre la variable
476
Captulo 27
residuos y los diagnsticos por casos para los casos que cumplan el criterio de
seleccin (los valores atpicos por encima de n desviaciones tpicas).
477
Regresin lineal
Excluir casos segn lista. Slo se incluirn en el anlisis los casos con valores
Excluir casos segn pareja. Los casos con datos completos para la pareja de
Reemplazar por la media. Se emplean todos los casos en los clculos, sustituyendo
Escribir una matriz de correlaciones o leer una matriz (en lugar de los datos
brutos) con el fin de obtener el anlisis de regresin (mediante el subcomando
MATRIX).
478
Captulo 27
Captulo
Estimacin curvilnea
28
selecciona Tiempo del conjunto de datos activo como variable independiente (en lugar
de una variable), el procedimiento Estimacin curvilnea generar una variable de
tiempo en la que la distancia temporal entre los casos es uniforme. Si se selecciona
Tiempo, la variable dependiente debe ser una medida de serie temporal. El anlisis
de series temporales requiere una estructura particular para los archivos de datos,
de manera que cada caso (cada fila) represente un conjunto de observaciones en
un momento determinado del tiempo y que la distancia temporal entre los casos
sea uniforme.
Supuestos. Represente los datos grficamente para determinar cmo se relacionan
480
Captulo 28
se utiliza un modelo lineal, se deben cumplir los siguientes supuestos: Para cada
valor de la variable independiente, la distribucin de la variable dependiente debe ser
normal. La varianza de distribucin de la variable dependiente debe ser constante
para todos los valores de la variable independiente. La relacin entre la variable
dependiente y la variable independiente debe ser lineal y todas las observaciones
deben ser independientes.
Figura 28-1
Tabla de resumen de la estimacin curvilnea
Figura 28-2
Estimacin curvilnea ANOVA
Figura 28-3
Coeficientes de estimacin curvilnea
481
Estimacin curvilnea
Figura 28-4
Grfico de estimacin curvilnea
482
Captulo 28
Figura 28-5
Cuadro de dilogo Estimacin curvilnea
Seleccionar una variable para etiquetar los casos en los diagramas de dispersin.
Para cada punto en el diagrama de dispersin, se puede utilizar la herramienta
de Identificacin de puntos para mostrar el valor de la variable utilizada en
Etiquetas de caso.
Pulsar en Guardar para guardar los valores pronosticados, los residuos y los
intervalos de pronstico como nuevas variables.
483
Estimacin curvilnea
Ver tabla de ANOVA. Muestra una tabla de anlisis de varianza de resumen para
cuadrtico puede utilizarse para modelar una serie que "despega" o una serie que
se amortigua.
Cbico. Modelo definido por la ecuacin Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3).
Potencia. Modelo cuya ecuacin es Y = b0 * (t**b1) ln(Y) = ln(b0) + (b1 * ln(t)).
Compuesto. Modelo cuya ecuacin es Y = b0 * (b1**t) ln(Y) = ln(b0) + (ln(b1) * t).
curva-S. Modelo cuya ecuacin es Y = e**(b0 + (b1/t)) ln(Y) = b0 + (b1/t).
Logstica. Modelo cuya ecuacin es Y = 1 / (1/u + (b0 * (b1**t))) o ln(1/Y - 1/u)
= ln(b0 + (ln(b1) * t)) donde u es el valor del lmite superior. Tras seleccionar
Logstico, especifique un valor para el lmite superior que ser usado en la ecuacin
de regresin. El valor debe ser un nmero positivo mayor que el valor mximo de
la variable dependiente.
Crecimiento. Modelo cuya ecuacin es Y = e**(b0 + (b1 * t)) ln(Y) = b0 + (b1 * t).
484
Captulo 28
(b1 * t).
Guardar variables. Para cada modelo seleccionado se pueden guardar los valores
pronosticados, los residuos (el valor observado de la variable dependiente menos el
valor pronosticado por el modelo) y los intervalos de pronstico (sus lmites superior
e inferior). En la ventana de resultados, se muestran en una tabla los nombres de las
nuevas variables y las etiquetas descriptivas.
Pronosticar casos. En el conjunto de datos activo, si se selecciona Tiempo como
Desde el perodo de estimacin hasta el ltimo caso. Pronostica los valores para
todos los casos del archivo, basndose en los casos del perodo de estimacin. El
perodo de estimacin, que se muestra en la parte inferior del cuadro de dilogo,
se define con el subcuadro de dilogo Rango de la opcin Seleccionar casos en
el men Datos. Si no se ha definido un perodo de estimacin, se utilizan todos
los casos para pronosticar los valores.
Predecir hasta. Predice los valores hasta la fecha especificada, hora o nmero de
485
Estimacin curvilnea
Captulo
Anlisis discriminante
29
ms caloras por da que las de los trpicos, y una proporcin mayor de la poblacin
de las zonas templadas vive en ncleos urbanos. Un investigador desea combinar esta
informacin en una funcin para determinar cmo de bien un individuo es capaz de
discriminar entre los dos grupos de pases. El investigador considera adems que el
tamao de la poblacin y la informacin econmica tambin pueden ser importantes.
El anlisis discriminante permite estimar los coeficientes de la funcin discriminante
lineal, que tiene el aspecto de la parte derecha de una ecuacin de regresin lineal
mltiple. Es decir, utilizando los coeficientes a, b, c y d, la funcin es:
D = a * clima + b * urbanos + c * poblacin + d * producto interior bruto per capita
487
488
Captulo 29
Si estas variables resultan tiles para discriminar entre las dos zonas climticas, los
valores de D sern diferentes para los pases templados y para los tropicales. Si se
utiliza un mtodo de seleccin de variables por pasos, quizs no se necesite incluir las
cuatro variables en la funcin.
Estadsticos. Para cada variable: medias, desviaciones tpicas, ANOVA univariado.
distintas, codificadas como nmeros enteros. Las variables independientes que sean
nominales deben ser recodificadas a variables dummy o de contraste.
Supuestos. Los casos deben ser independientes. Las variables predictoras deben
tener una distribucin normal multivariada y las matrices de varianzas-covarianzas
intra-grupos deben ser iguales en todos los grupos. Se asume que la pertenencia al
grupo es mutuamente exclusiva (es decir, ningn caso pertenece a ms de un grupo) y
exhaustiva de modo colectivo (es decir, todos los casos son miembros de un grupo).
El procedimiento es ms efectivo cuando la pertenencia al grupo es una variable
verdaderamente categrica; si la pertenencia al grupo se basa en los valores de una
variable continua (por ejemplo, un cociente de inteligencia alto respecto a uno bajo),
considere el uso de la regresin lineal para aprovechar la informacin ms rica
ofrecida por la propia variable continua.
Figura 29-1
Resultados del anlisis discriminante
Autovalores
Funcin
1
Autovalor
1.002
% de
varianza
100.0
%
acumulad
o
100.0
Correlaci
n cannica
.707
Lambda de Wilks
Contraste de las
funciones
1
Lambda de
Wilks
.499
Chi-cuadrado
31.934
gl
4
Sig.
.000
489
Anlisis discriminante
Matriz de estructura
Funcin
1
Ingesta diaria de caloras
.986
Log(10) de PIB_CAP
.790
Habitantes en ciudades
(%)
.488
Log(10) de POBLAC
.082
Funcin
templado
1
-.869
1.107
E Seleccione una variable de agrupacin con valores enteros y pulse en Definir rango
490
Captulo 29
E Seleccione las variables independientes o predictoras. (Si la variable de agrupacin
Usar mtodo de inclusin por pasos. Utiliza el anlisis por pasos para controlar la
491
Anlisis discriminante
Slo se utilizan los casos con el valor especificado en la variable de seleccin para
derivar las funciones discriminantes. Tanto para los casos seleccionados como para
los no seleccionados se generan resultados de clasificaciones y estadsticos. Este
proceso ofrece un mecanismo para clasificar casos nuevos basados en datos previos
o para dividir los datos en subconjuntos de contraste y comprobacin para realizar
procedimientos de validacin en el modelo generado.
Descriptivos. Las opciones disponibles son: Medias (que incluye las desviaciones
factor sobre la igualdad de las medias de grupo para cada variable independiente.
492
Captulo 29
Covarianza total. Muestra la matriz de covarianza para todos los casos, como
493
Anlisis discriminante
lambda de Wilks. Mtodo para la seleccin de variables por pasos del anlisis
variables independientes respecto al promedio para todos los casos. Una distancia
de Mahalanobis grande identificar a un caso que tenga valores extremos en una
o ms de las variables independientes.
Menor razn F. Mtodo para la seleccin de variables en los anlisis por pasos que
V de Rao. Medida de las diferencias entre las medias de los grupos. Tambin
494
Captulo 29
495
Anlisis discriminante
Mostrar. Las opciones de presentacin disponibles son: Resultados por casos, Tabla
de resumen y Clasificacin dejando uno fuera.
Resultados para cada caso. Se muestran, para cada caso, los cdigos del grupo
Clasificacin dejando uno fuera. Se clasifica cada caso del anlisis mediante la
funcin derivada a partir de todos los casos, excepto el propio caso. Tambin
conocido como mtodo-U.
Reemplazar los valores perdidos con la media. Seleccione esta opcin para sustituir la
media de una variable independiente para un valor perdido slo durante la fase de
clasificacin.
Usar matriz de covarianzas. Existe la opcin de clasificar los casos utilizando una
Grupos combinados. Crea un diagrama de dispersin, con todos los grupos, de los
valores en las dos primeras funciones discriminantes. Si slo hay una funcin,
en su lugar se muestra un histograma.
Grupos separados. Crea diagramas de dispersin, de los grupos por separado, para
los valores en las dos primeras funciones discriminantes. Si slo hay una funcin
se muestra un histograma en su lugar.
Mapa territorial. Grfico de las fronteras utilizadas para clasificar los casos en
496
Captulo 29
Es posible aadir variables nuevas al archivo de datos activo. Las opciones disponibles
son las de grupo de pertenencia pronosticado (una nica variable), puntuaciones
discriminantes (una variable para cada funcin discriminante en la solucin) y
probabilidades de pertenencia al grupo segn las puntuaciones discriminantes (una
variable para cada grupo).
Tambin se puede exportar informacin del modelo al archivo especificado en
formato XML (PMML). SmartScore y servidor de SPSS (un producto independiente)
pueden utilizar este archivo de modelo para aplicar la informacin del modelo en
otros archivos de datos con fines de puntuacin.
497
Anlisis discriminante
Captulo
Anlisis factorial
30
Existen tres mtodos disponibles para calcular las puntuaciones factoriales; y las
puntuaciones pueden guardarse como variables para anlisis adicionales.
Ejemplo. Qu actitudes subyacentes hacen que las personas respondan a las preguntas
de una encuesta poltica de la manera en que lo hacen? Examinando las correlaciones
entre los elementos de la encuesta se deduce que hay una superposicin significativa
entre los diversos subgrupos de elementos (las preguntas sobre los impuestos tienden
a estar correlacionadas entre s, las preguntas sobre temas militares tambin estn
correlacionadas entre s, y as sucesivamente). Con el anlisis factorial, se puede
investigar el nmero de factores subyacentes y, en muchos casos, se puede identificar
lo que los factores representan conceptualmente. Adicionalmente, se pueden calcular
las puntuaciones factoriales para cada encuestado, que pueden utilizarse en anlisis
subsiguientes. Por ejemplo, es posible construir un modelo de regresin logstica para
predecir el comportamiento de voto basndose en las puntuaciones factoriales.
499
500
Captulo 30
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin tpica.
Para cada anlisis factorial: matriz de correlaciones de variables, incluidos niveles de
significacin, determinante, inversa; matriz de correlaciones reproducida, que incluye
anti-imagen; solucin inicial (comunalidades, autovalores y porcentaje de varianza
explicada); KMO (medida de la adecuacin muestral de Kaiser-Meyer-Olkin) y
prueba de esfericidad de Bartlett; solucin sin rotar, que incluye saturaciones
factoriales, comunalidades y autovalores; solucin rotada, que incluye la matriz de
configuracin rotada y la matriz de transformacin. Para rotaciones oblicuas: las
matrices de estructura y de configuracin rotadas; matriz de coeficientes para el
clculo de las puntuaciones factoriales y matriz de covarianzas entre los factores.
Grficos: grfico de sedimentacin y grfico de las saturaciones de los dos o tres
primeros factores.
Datos. Las variables deben ser cuantitativas a nivel de intervalo o de razn. Los datos
501
Anlisis factorial
Figura 30-1
Resultados del anlisis factorial
Estadsticos descriptivos
Media
Desviacin
tpica
N del
anlisis
Esperanza de vida
femenina
72.63
8.03
24
Mortalidad infantil
(muertes por 1000
nacimientos vivos)
36.892
31.104
24
Alfabetizacin (%)
85.54
19.29
24
22.625
8.747
24
Nmero promedio de
hijos
2.929
1.277
24
Habitantes en
ciudades (%)
61.38
20.61
24
Log(10) de PIB_CAP
3.4876
.6474
24
Aumento de la
poblacin (% anual)
1.456
.855
24
3.1376
1.7112
24
8.04
2.18
24
4.3088
.7324
24
Tasa
Nacimientos/Defunciones
Tasa de mortalidad
(por 1.000 habitantes)
Log(10) de POBLAC
502
Captulo 30
Comunalidades
Inicial
Extraccin
Esperanza de vida
femenina
1.000
.950
Mortalidad infantil
(muertes por 1000
nacimientos vivos)
1.000
.949
Alfabetizacin (%)
1.000
.842
1.000
.975
Nmero promedio de
hijos
1.000
.891
Habitantes en ciudades
(%)
1.000
.691
Log(10) de PIB_CAP
1.000
.884
Aumento de la poblacin
(% anual)
1.000
.974
1.000
.956
1.000
.776
Log(10) de POBLAC
1.000
.652
Tasa
Nacimientos/Defunciones
Autovalores iniciales
Total
6.960
% de la
varianza
63.275
%
acumulado
63.275
Total
6.960
% de la
varianza
63.275
%
acumulado
63.275
Total
6.910
% de la
varianza
62.819
%
acumulado
62.819
2.579
23.446
86.721
2.579
23.446
86.721
2.629
23.902
86.721
.612
5.562
92.283
.361
3.281
95.564
.218
1.985
97.549
.130
1.183
98.732
6.131E-02
.557
99.290
3.775E-02
.343
99.633
2.610E-02
.237
99.870
10
9.840E-03
8.946E-02
99.959
11
4.461E-03
4.055E-02
100.000
Componente
1
503
Anlisis factorial
-.964
.962
Log(10) de PIB_CAP
-.937
.910
.384
.906
.264
-.898
.830
.535
-.789
.263
-.876
Tasa
Nacimientos/Defunciones
.464
.861
Log(10) de POBLAC
.434
-.681
504
Captulo 30
2
.994
.107
-.107
.994
aument o de la poblac
.5
tas a de natalidad (p
nmero promedio de h
0.0 de pib_cap
log(10)
mortalidad infantil
Co mpon ente 2
-.5
log(10) de poblac
tas a de mortalidad (
-1. 0
-1. 0
-.5
0.0
.5
1.0
Co mpo nen te 1
505
Anlisis factorial
Figura 30-2
Cuadro de dilogo Anlisis factorial
En el anlisis factorial, slo se usarn los casos con ese valor para la variable de
seleccin.
506
Captulo 30
y el nmero de casos vlidos para cada variable. La solucin inicial muestra las
comunalidades iniciales, los autovalores y el porcentaje de varianza explicada.
Matriz de correlaciones. Las opciones disponibles son: coeficientes, niveles de
507
Anlisis factorial
508
Captulo 30
que proporciona las estimaciones de los parmetros que con mayor probabilidad
han producido la matriz de correlaciones observada, si la muestra procede de una
distribucin normal multivariada. Las correlaciones se ponderan por el inverso de
la unicidad de las variables, y se emplea un algoritmo iterativo.
variables incluidas en el anlisis como una muestra del universo de las variables
posibles. Este mtodo maximiza el Alfa de Cronbach para los factores.
covarianzas.
escalas distintas.
509
Anlisis factorial
Solucin factorial sin rotar (Anlisis factorial). Muestra las saturaciones factoriales
Criterio Oblimin directo. Mtodo para la rotacin oblicua (no ortogonal). Cuando
delta es igual a cero (el valor por defecto) las soluciones son las ms oblicuas. A
medida que delta se va haciendo ms negativo, los factores son menos oblicuos.
Para anular el valor por defecto 0 para delta, introduzca un nmero menor o
igual que 0,8.
510
Captulo 30
del mtodo varimax, que simplifica los factores, y el mtodo quartimax, que
simplifica las variables. Se minimiza tanto el nmero de variables que saturan alto
en un factor como el nmero de factores necesarios para explicar una variable.
Rotacin Promax. Rotacin oblicua que permite que los factores estn
saturaciones factoriales para los tres primeros factores. Para una solucin de dos
factores, se representa un diagrama bidimensional. No se muestra el grfico si
slo se extrae un factor. Si se solicita la rotacin, los diagramas representan
las soluciones rotadas.
N mximo de iteraciones para convergencia. Permite especificar el nmero mximo
de pasos que el algoritmo puede seguir para llevar a cabo la rotacin.
511
Anlisis factorial
Guardar como variables. Crea una nueva variable para cada factor en la solucin final.
Seleccione uno de los siguientes mtodos alternativos para calcular las puntuaciones
factoriales: Regresin, Bartlett o Anderson-Rubin.
por los cuales se multiplican las variables para obtener puntuaciones factoriales.
Tambin muestra las correlaciones entre las puntuaciones factoriales.
Valores perdidos. Permite especificar el tratamiento que reciben los valores perdidos.
Las selecciones disponibles son: Excluir casos segn lista, Excluir casos segn
pareja y Reemplazar por la media.
512
Captulo 30
Captulo
Seleccin de procedimientos
para la conglomeracin
31
513
514
Captulo 31
Siempre que todas las variables sean del mismo tipo, el procedimiento Anlisis
de conglomerados jerrquico podr analizar variables de intervalo (continuas), de
recuento o binarias.
Anlisis de conglomerados de K-medias. El uso del procedimiento Anlisis de
Captulo
Anlisis de conglomerados en
dos fases
32
conglomerados (CF) que resume los registros, el algoritmo en dos fases puede
analizar archivos de datos de gran tamao.
Ejemplo. Las empresas minoristas y de venta de productos para el consumidor suelen
aplicar tcnicas de conglomeracin a los datos que describen los hbitos de consumo,
sexo, edad, nivel de ingresos, etc. de los clientes. Estas empresas adaptan sus
estrategias de desarrollo de productos y de marketing en funcin de cada grupo de
consumidores para aumentar las ventas y el nivel de fidelidad a la marca.
Estadsticos. El procedimiento genera criterios de informacin (AIC o BIC) segn
515
516
Captulo 32
dos conglomerados.
probabilidad entre las variables. Las variables continuas se supone que tienen
una distribucin normal, mientras que las variables categricas se supone que son
multinomiales. Se supone que todas las variables son independientes.
Eucldea. La medida eucldea es la distancia segn una lnea recta entre dos
conglomerados. Slo se puede utilizar cuando todas las variables son continuas.
Nmero de conglomerados. Esta opcin permite especificar cmo se va a determinar
el nmero de conglomerados.
517
Anlisis de conglomerados en dos fases
Los casos representan los objetos que se van a conglomerar y las variables representan
los atributos en los que se va a basar la conglomeracin.
Orden de casos. Observe que el rbol de caractersticas de conglomerados y la
solucin final pueden depender del orden de los casos. Para minimizar los efectos del
orden, ordene los casos aleatoriamente. Puede que desee obtener varias soluciones
distintas con los casos ordenados en distintos rdenes aleatorios para comprobar la
estabilidad de una solucin determinada. En situaciones en que esto resulta difcil
debido a unos tamaos de archivo demasiado grandes, se pueden sustituir varias
ejecuciones por una muestra de casos ordenados con distintos rdenes aleatorios.
Supuestos. La medida de la distancia de la verosimilitud supone que las variables del
518
Captulo 32
Medias para comprobar la independencia existente entre una variable continua y otra
categrica. Utilice el procedimiento Explorar para comprobar la normalidad de una
variable continua. Utilice el procedimiento Prueba de chi-cuadrado para comprobar si
una variable categrica tiene una determinada distribucin multinomial.
Para obtener un anlisis de conglomerados en dos fases
E Elija en los mens:
Analizar
Clasificar
Conglomerado en dos fases...
E Seleccione una o varias variables categricas o continuas.
Si lo desea, puede:
519
Anlisis de conglomerados en dos fases
Tratamiento de valores atpicos. Este grupo permite tratar los valores atpicos de
520
Captulo 32
continuas tipificadas. Todas las variables continuas que no estn tipificadas deben
dejarse como variables en la lista Para tipificar. Para ahorrar algn tiempo y trabajo
para el ordenador, puede seleccionar todas las variables continuas que ya haya
tipificado como variables en la lista Asumidas como tipificadas.
Opciones avanzadas
Criterios de ajuste del rbol CF. Los siguientes ajustes del algoritmo de conglomeracin
Umbral del cambio en distancia inicial. ste es el umbral inicial que se utiliza para
N mximo de ramas (por nodo hoja). Nmero mximo de nodos filiales que puede
rbol CF.
Mximo nmero posible de nodos. Indica el nmero mximo de nodos del rbol CF
521
Anlisis de conglomerados en dos fases
puede agotar los recursos del sistema y afectar negativamente al rendimiento del
procedimiento. Como mnimo, cada nodo requiere 16 bytes.
Actualizacin del modelo de conglomerados. Este grupo permite importar y actualizar
522
Captulo 32
variacin dentro del conglomerado de cada variable. Para cada variable categrica, se
genera un grfico de barras agrupado, mostrando la frecuencia de la categora por
identificador de conglomerado. Para cada variable continua, se genera un grfico de
barras de error, indicando las barras de error por identificador de conglomerado.
Grfico de sectores de los conglomerados. Muestra un grfico de sectores que
Ordenar variables. Esta opcin determina si los grficos que se crearn para cada
523
Anlisis de conglomerados en dos fases
524
Captulo 32
Descriptivos por conglomerado. Muestra dos tablas que describen las variables de
Frecuencias de los conglomerados. Muestra una tabla que informa del nmero de
Criterio de informacin (AIC o BIC). Muestra una tabla que contiene los valores de
datos activo.
Exportar rbol CF. Esta opcin permite guardar el estado actual del rbol de
Captulo
Anlisis de conglomerados
jerrquico
33
pertenencia a los conglomerados para una solucin nica o una serie de soluciones.
Grficos: dendrogramas y diagramas de tmpanos.
Datos. Las variables pueden ser cuantitativas, binarias o datos de recuento
(frecuencias). El escalamiento de las variables es un aspecto importante, ya que las
diferencias en el escalamiento pueden afectar a las soluciones de conglomeracin.
Si las variables muestran grandes diferencias en el escalamiento (por ejemplo,
una variable se mide en dlares y la otra se mide en aos), debera considerar la
posibilidad de estandarizarlas (esto puede llevarse a cabo automticamente mediante
el propio procedimiento Anlisis de conglomerados jerrquico).
525
526
Captulo 33
527
Anlisis de conglomerados jerrquico
Conglomerado de pertenencia
4
Conglomerados
Etiqueta
Caso
3
2
Conglomerados Conglomerados
Argentina
Brazil
Chile
Domincan
R.
Indonesia
Austria
Canada
Denmark
Italy
10
Japan
11
Norway
12
Switzerland
13
Bangladesh
14
India
15
Bolivia
16
Paraguay
X
X
X
X
X
X
X
X
X
X
X
X
X
3:Chile
3
1:Argentina
2
4:Domincan R.
4
5:Indonesia
5
2:Brazil
X
X
X
X
X
X
X
X
16
15:Bolivia
15
6:Austria
6
16:Paraguay
X
X
X
X
X
X
X
X
9
7:Canada
7
12
11:Norway
11
8:Denmark
8
12:Switzerland
Caso
X
X
X
X
X
X
X
X
10:Japan
10
9:Italy
14
13:Bangladesh
13
14:India
Nmero
de
conglomerados
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
XX XXX XXX X
X XXX XXX X
X XXX XXX X
X XXX XXX X
X XXX XXX X
X XXX XXX X
X XXX XXX X
X XXX XXX X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
XXX
XXX
X X
X X
X X
X X
X X
528
Captulo 33
* * * * * * * * * * * * * ANLISIS DE CONGLOMERADOS JERRQUICO * * * * * * * * * * *
Nm.
0
5
10
15
20
25
+---------+---------+---------+---------+---------+
LIFEEXPF
BABYMORT
LITERACY
BIRTH_RT
5
3
6
FERTILTY
URBAN
10
1
LOG_GDP
POP_INCR
8
4
B_TO_D
DEATH_RT
9
7
LOG_POP
11
529
Anlisis de conglomerados jerrquico
de phi-cuadrado.
530
Captulo 33
Transformar valores. Permite estandarizar los valores de los datos, para los casos
o las variables, antes de calcular las proximidades (no est disponible para datos
binarios). Los mtodos disponibles de estandarizacin son: Puntuaciones z, Rango -1
a 1, Rango 0 a 1, Magnitud mxima de 1, Media de 1 y Desviacin tpica 1.
Transformar medidas. Permite transformar los valores generados por la medida de
cada etapa, las distancias entre los casos o los conglomerados que se combinan, as
como el ltimo nivel del proceso de aglomeracin en el que cada caso (o variable) se
uni a su conglomerado correspondiente.
Matriz de distancias. Proporciona las distancias o similaridades entre los elementos.
Conglomerado de pertenencia. Muestra el conglomerado al cual se asigna cada caso
en una o varias etapas de la combinacin de los conglomerados. Las opciones
disponibles son: Solucin nica y Rango de soluciones.
531
Anlisis de conglomerados jerrquico
532
Captulo 33
para una solucin nica o un rango de soluciones. Las variables guardadas pueden
emplearse en anlisis posteriores para explorar otras diferencias entre los grupos.
Captulo
Anlisis de conglomerados de
K-medias
34
de ANOVA. Para cada caso: informacin del conglomerado, distancia desde el centro
del conglomerado.
533
534
Captulo 34
Datos. Las variables deben ser cuantitativas en el nivel de intervalo o de razn. Si las
variables son binarias o recuentos, utilice el procedimiento Anlisis de conglomerados
jerrquicos.
Orden de casos y centro de conglomerados iniciales. El algoritmo por defecto
para elegir centros de conglomerados iniciales no es invariable con respecto a la
ordenacin de casos. La opcin Usar medias actualizadas del cuadro de dilogo Iterar
hace que la solucin resultante dependa potencialmente del orden de casos con
independencia de cmo se eligen los centros de conglomerados iniciales. Si va a
utilizar alguno de estos mtodos, puede que desee obtener varias soluciones distintas
con los casos ordenados en distintos rdenes aleatorios para comprobar la estabilidad
de una solucin determinada. La especificacin de los centros de conglomerados
iniciales y la no utilizacin de la opcin Usar medias actualizadas evita los problemas
relacionados con el orden de casos. No obstante, la ordenacin de los centros de
conglomerados iniciales puede afectar a la solucin en caso de haber distancias
empatadas desde los casos a los centros de conglomerados. Para evaluar la estabilidad
de una solucin determinada, puede comparar los resultados de los anlisis con las
distintas permutaciones de los valores de centros iniciales.
Supuestos. Las distancias se calculan utilizando la distancia eucldea simple. Si desea
535
Anlisis de conglomerados de K-medias
Figura 34-1
Resultados del anlisis de conglomerados de K-medias
Historial de iteraciones
Cambio en los centros de los conglomerados
Iteracin
1
1
1.932
2
1.596
3
3.343
4
2.724
.000
.314
.466
.471
.861
.195
.172
.414
.604
.150
.000
.337
.000
.167
.237
.253
.000
.071
.287
.199
.623
.000
.000
.160
.000
.074
.000
.084
.000
.077
.000
.080
10
.000
.000
.185
.097
536
Captulo 34
1
-1.70745
2
.62767
3
.16816
4
-.30863
ZESPVIDA
ZALFABET
-2.52826
.80611
-.28417
-.15939
-2.30833
.73368
-.81671
.13880
ZINC_POB
.59747
-.95175
1.45301
.13400
ZMORTINF
2.43210
-.80817
.25622
.22286
ZTASA_NA
1.52607
-.99285
1.13716
.12929
ZTASA_M
2.10314
.31319
-.71414
-.44640
ZLOG_PIB
-1.77704
.94249
-.16871
-.58745
ZNAC_DEF
-.29856
-.84758
1.45251
.19154
ZFERTILI
1.51003
-.87669
1.27010
-.12150
.83475
-.22199
-.49499
.34577
ZLOG_POB
2
7.924
7.924
5.640
5.246
5.627
3.249
3
5.640
4
5.627
5.246
3.249
2.897
2.897
537
Anlisis de conglomerados de K-medias
ANOVA
Conglomerado
Error
ZURBANA
Media
cuadrtica
10.409
Media
gl
cuadrtica
3
.541
ZESPVIDA
19.410
ZALFABET
18.731
ZINC_POB
18.464
ZMORTINF
68
F
19.234
Sig.
.000
.210
68
92.614
.000
.229
68
81.655
.000
.219
68
84.428
.000
18.621
.239
68
77.859
.000
ZTASA_NA
19.599
.167
68
117.339
.000
ZTASA_M
13.628
.444
68
30.676
.000
ZLOG_PIB
17.599
.287
68
61.313
.000
ZNAC_DEF
16.316
.288
68
56.682
.000
ZFERTILI
18.829
.168
68
112.273
.000
3.907
.877
68
4.457
.006
ZLOG_POB
gl
Las pruebas F slo se deben utilizar con una finalidad descriptiva puesto que los
conglomerados han sido elegidos para maximizar las diferencias entre los casos en
diferentes conglomerados. Los niveles crticos no son corregidos, por lo que no pueden
interpretarse como pruebas de la hiptesis de que los centros de los conglomerados son
iguales.
538
Captulo 34
Figura 34-2
Cuadro de dilogo Anlisis de conglomerados de K-medias
539
Anlisis de conglomerados de K-medias
Para conseguir la mxima eficacia, tome una muestra de los casos y seleccione el
mtodo Iterar y clasificar para determinar los centros de los conglomerados. Seleccione
Escribir finales en. A continuacin, restaure el archivo de datos completo, seleccione
el mtodo Slo clasificar y seleccione Leer iniciales de para clasificar el archivo
completo utilizando los centros estimados a partir de la muestra. Puede escribir en
un archivo o conjunto de datos, as como leer desde stos. Los conjuntos de datos
estn disponibles para su uso posterior durante la misma sesin, pero no se guardarn
como archivos a menos que se hayan guardado explcitamente antes de que finalice la
sesin. El nombre de un conjunto de datos debe cumplir las normas de denominacin
de variables de SPSS. Si desea obtener ms informacin, consulte Nombres de
variable en Captulo 5 en p. 99.
Nota: estas opciones slo estn disponibles si se selecciona el mtodo Iterar y clasificar
en el cuadro de dilogo Anlisis de conglomerados de K-medias.
N mximo de iteraciones. Limita el nmero de iteraciones en el algoritmo k-medias.
540
Captulo 34
Puede guardar informacin sobre la solucin como nuevas variables para que puedan
ser utilizadas en anlisis subsiguientes:
Conglomerado de pertenencia. Crea una nueva variable que indica el conglomerado
final al que pertenece cada caso. Los valores de la nueva variable van desde el 1 hasta
el nmero de conglomerados.
Distancia desde centro del conglomerado. Crea una nueva variable que indica la
distancia eucldea entre cada caso y su centro de clasificacin.
541
Anlisis de conglomerados de K-medias
variables para cada uno de los conglomerados. Por defecto se selecciona entre
los datos un nmero de casos debidamente espaciados igual al nmero de
conglomerados. Los centros iniciales de los conglomerados se utilizan como
criterio para una primera clasificacin y, a partir de ah, se van actualizando.
anlisis de varianza que incluye las pruebas F univariadas para cada variable
de aglomeracin. Las pruebas F son slo descriptivas y las probabilidades
resultantes no deben ser interpretadas. La tabla de ANOVA no se mostrar si se
asignan todos los casos a un nico conglomerado.
Informacin del conglomerado para cada caso. Muestra, para cada caso, el
Excluir casos segn lista. Excluye los casos con valores perdidos para cualquier
Excluir casos segn pareja. Asigna casos a los conglomerados en funcin de las
distancias que se calculan desde todas las variables con valores no perdidos.
Captulo
Pruebas no paramtricas
35
es aleatorio.
Prueba de Kolmogorov-Smirnov para una muestra. Compara la funcin de distribucin
acumulativa observada de una variable con una distribucin terica especificada, que
puede ser normal, uniforme, exponencial o de Poisson.
Pruebas para dos muestras independientes. Compara dos grupos de casos en una
544
Captulo 35
Adems, para todas las pruebas citadas anteriormente estn disponibles los cuartiles
y la media, la desviacin tpica, el mnimo, el mximo y, por ltimo, el nmero de
casos no perdidos.
Prueba de chi-cuadrado
El procedimiento Prueba de chi-cuadrado tabula una variable en categoras y calcula
un estadstico de chi-cuadrado. Esta prueba de bondad de ajuste compara las
frecuencias observadas y esperadas en cada categora para contrastar que todas las
categoras contengan la misma proporcin de valores o que cada categora contenga
una proporcin de valores especificada por el usuario.
Ejemplos. La prueba de chi-cuadrado podra utilizarse para determinar si una bolsa
545
Pruebas no paramtricas
Figura 35-1
Resultados del procedimiento Prueba de chi-cuadrado
Color de la jalea
N
observado
6
N
esperado
5.9
Residual
.1
Marrn
33
35.7
-2.7
Verde
11.9
-2.9
Amarillo
17
23.8
-6.8
Naranja
22
17.8
4.2
Rojo
26
17.8
8.2
Total
113
Azul
Color de la jalea
N observado
6
N esperado
18.8
Residual
-12.8
Marrn
33
18.8
14.2
Verde
18.8
-9.8
Amarillo
17
18.8
-1.8
Naranja
22
18.8
3.2
Rojo
26
18.8
7.2
Total
113
Azul
546
Captulo 35
Estadsticos de contraste
Chi-cuadrado1
Color
27.973
gl
Sig. asintt.
5
.000
independiente.
E Si lo desea, puede pulsar en Opciones para obtener estadsticos descriptivos, cuartiles
547
Pruebas no paramtricas
548
Captulo 35
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable
Prueba binomial
El procedimiento Prueba binomial compara las frecuencias observadas de las
dos categoras de una variable dicotmica con las frecuencias esperadas en una
distribucin binomial con un parmetro de probabilidad especificado. Por defecto, el
parmetro de probabilidad para ambos grupos es 0,5. Para cambiar las probabilidades,
puede introducirse una proporcin de prueba para el primer grupo. La probabilidad
del segundo grupo ser 1 menos la probabilidad especificada para el primer grupo.
Ejemplo. Si se lanza una moneda al aire, la probabilidad de que salga cara es 1/2.
549
Pruebas no paramtricas
y cuartiles.
Datos. Las variables de contraste deben ser numricas y dicotmicas. Para
Moneda
Grupo 1
Categora
Cara
Grupo 2
Cruz
Total
N
30
10
.25
40
1.00
1. Basado en la aproximacin Z.
Proporcin
observada
.75
Prop. de
prueba
.50
Sig.
asintt.
(bilateral)
.0031
550
Captulo 35
Figura 35-5
Cuadro de dilogo Prueba binomial
551
Pruebas no paramtricas
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se
Excluir casos segn lista. Se excluirn de todos los anlisis los casos con valores
Prueba de rachas
El procedimiento Prueba de rachas contrasta si es aleatorio el orden de aparicin de
dos valores de una variable. Una racha es una secuencia de observaciones similares.
Una muestra con un nmero excesivamente grande o excesivamente pequeo de
rachas sugiere que la muestra no es aleatoria.
Ejemplos. Suponga que se realiza una encuesta a 20 personas para saber si compraran
un producto. Si todas estas personas fueran del mismo sexo, se pondra seriamente en
duda la supuesta aleatoriedad de la muestra. La prueba de rachas se puede utilizar
para determinar si la muestra fue extrada de manera aleatoria.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos
y cuartiles.
Datos. Las variables deben ser numricas. Para convertir las variables de cadena en
552
Captulo 35
553
Pruebas no paramtricas
seleccionadas. Puede utilizar como punto de corte los valores observados para la
media, la mediana o la moda, o bien un valor especificado. Los casos con valores
menores que el punto de corte se asignarn a un grupo y los casos con valores
mayores o iguales que el punto de corte se asignarn a otro grupo. Se lleva a cabo una
prueba para cada punto de corte seleccionado.
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable
554
Captulo 35
y cuartiles.
Datos. Utilice variables cuantitativas (a nivel de medida de razn o de intervalo).
Supuestos. La prueba de Kolmogorov-Smirnov asume que los parmetros de la
distribucin de contraste se han especificado previamente. Este procedimiento estima
los parmetros a partir de la muestra. La media y la desviacin tpica de la muestra
son los parmetros de una distribucin normal, los valores mnimo y mximo de
la muestra definen el rango de la distribucin uniforme, la media muestral es el
parmetro de la distribucin de Poisson y la media muestral es el parmetro de la
distribucin exponencial. La capacidad de la prueba para detectar desviaciones a
partir de la distribucin hipotetizada puede disminuir gravemente. Para contrastarla
con una distribucin normal con parmetros estimados, considere la posibilidad de
utilizar la prueba de K-S Lillliefors (disponible en el procedimiento Explorar).
555
Pruebas no paramtricas
Figura 35-10
Resultados del procedimiento Prueba de Kolmogorov-Smirnov para una muestra
Prueba de Kolmogorov-Smirnov para una muestra
Ingresos
20
N
Parmetros normales 1,2
Diferencias ms extremas
Media
56250.00
Desviacin tpica
45146.40
Absoluta
.170
Positiva
.170
Negativa
-.164
Z de Kolmogorov-Smirnov
.760
Sig. asintt. (bilateral)
.611
556
Captulo 35
Figura 35-11
Cuadro de dilogo Prueba de Kolmogorov-Smirnov para una muestra
prueba independiente.
E Si lo desea, puede pulsar en Opciones para obtener estadsticos descriptivos, cuartiles
557
Pruebas no paramtricas
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable
558
Captulo 35
Das de
utilizacin
Aparato
Tipo
Antiguo
Rango
promedio
Suma de
rangos
10
14.10
141.00
Tipo
Nuevo
10
6.90
69.00
Total
20
Estadsticos de contraste
Das de
utilizacin
U de
Mann-Whitney
14.000
W de Wilcoxon
69.000
-2.721
Sig. asintt.
(bilateral)
.007
Sig. exacta
[2*(Sig.
unilateral)]
.005
559
Pruebas no paramtricas
Figura 35-14
Cuadro de dilogo Pruebas para dos muestras independientes
560
Captulo 35
los rangos del grupo denominado primero en el cuadro de dilogo Dos muestras
independientes: Definir grupos.
La prueba Z de Kolmogorov-Smirnov y la prueba de rachas de
Wald-Wolfowitz son pruebas ms generales que detectan las diferencias entre las
posiciones y las formas de las distribuciones. La prueba de Kolmogorov-Smirnov se
basa en la diferencia mxima absoluta entre las funciones de distribucin acumulada
observadas para ambas muestras. Cuando esta diferencia es significativamente
grande, se consideran diferentes las dos distribuciones. La prueba de rachas de
Wald-Wolfowitz combina y ordena las observaciones de ambos grupos. Si las dos
muestras proceden de una misma poblacin, los dos grupos deben dispersarse
aleatoriamente en la ordenacin de los rangos.
La prueba de reacciones extremas de Moses presupone que la variable
experimental afectar a algunos sujetos en una direccin y a otros sujetos en la
direccin opuesta. La prueba contrasta las respuestas extremas comparndolas con
un grupo de control. Esta prueba se centra en la amplitud del grupo de control y
supone una medida de la influencia de los valores extremos del grupo experimental
en la amplitud al combinarse con el grupo de control. El grupo de control se define
en el cuadro Grupo 1 del cuadro de dilogo Dos muestras independientes: Definir
grupos. Las observaciones de ambos grupos se combinan y ordenan. La amplitud del
grupo de control se calcula como la diferencia entre los rangos de los valores mayor
y menor del grupo de control ms 1. Debido a que los valores atpicos ocasionales
pueden distorsionar fcilmente el rango de la amplitud, de manera automtica se
recorta de cada extremo un 5% de los casos de control.
Para segmentar el archivo en dos grupos o muestras, introduzca un valor entero para
el Grupo 1 y otro valor para el Grupo 2. Los casos con otros valores se excluyen del
anlisis.
561
Pruebas no paramtricas
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable
562
Captulo 35
Ejemplo. En general, cuando una familia vende su casa logra obtener la cantidad que
Rangos
Rango
promedio
N
Precio de
salida Precio de
venta
Rangos
negativos
Rangos
positivos
Empates
Total
10
Suma de
rangos
1.50
1.50
4.93
34.50
563
Pruebas no paramtricas
Estadsticos de contraste
-2.3131
.021
564
Captulo 35
E Seleccione uno o ms pares de variables, como se indica:
Pulse en el botn de flecha para mover el par hasta la lista Contrastar pares. Si
lo desea, pueden seleccionar ms parejas de variables. Para eliminar un par de
variables del anlisis, seleccione el par en la lista Contrastar pares y pulse en el
botn de flecha.
565
Pruebas no paramtricas
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable
566
Captulo 35
567
Pruebas no paramtricas
Figura 35-21
Cuadro de dilogo Pruebas para varias muestras independientes
568
Captulo 35
Para definir el rango, introduzca valores enteros para el mnimo y el mximo que se
correspondan con las categoras mayor y menor de la variable de agrupacin. Se
excluyen los casos con valores fuera de los lmites. Por ejemplo, si indica un valor
mnimo de 1 y un valor mximo de 3, nicamente se utilizarn los valores enteros
entre 1 y 3. Debe indicar ambos valores y el valor mnimo ha ser menor que el
mximo.
569
Pruebas no paramtricas
Excluir casos segn prueba. Cuando se especifican varias pruebas, cada una se
Excluir casos segn lista. Los casos con valores perdidos para cualquier variable
policas y profesores? Se pide a diez personas que ordenen estas cuatro profesiones
por orden de prestigio. La prueba de Friedman indica que la gente asocia diferentes
niveles de prestigio con estas cuatro profesiones.
Estadsticos. Media, desviacin tpica, mnimo, mximo, nmero de casos no perdidos
570
Captulo 35
Figura 35-24
Resultados del procedimiento Pruebas para varias muestras relacionadas
Rangos
Rango
medio
Doctor
1.50
Abogado
2.50
Polica
3.40
Profesor
2.60
571
Pruebas no paramtricas
572
Captulo 35
Captulo
36
574
Captulo 36
575
Anlisis de respuestas mltiples
las variables estn codificadas como categoras, defina el rango de las categoras.
E Introduzca un nombre distintivo para cada conjunto de respuestas mltiples.
E Pulse Aadir para agregar el conjunto de respuestas mltiples a la lista de conjuntos
definidos.
576
Captulo 36
Excluir los casos segn lista dentro de las dicotomas. Excluye los casos con
Excluir los casos segn lista dentro de las categoras. Excluye los casos con
577
Anlisis de respuestas mltiples
grupo. Las frecuencias y los porcentajes de las tres lneas areas se muestran en una
tabla de frecuencias. Si observa que ningn encuestado ha mencionado ms de dos
lneas areas, podra crear dos variables, cada una con tres cdigos, uno para cada
lnea area. Si define un conjunto de categoras mltiples, los valores se tabulan
aadiendo los mismos cdigos en las variables elementales juntas. El conjunto
de valores resultantes es igual a los de cada una de las variables elementales. Por
ejemplo, 30 respuestas para United son la suma de las cinco respuestas de United para
la lnea area 1 y las 25 respuestas de United para la lnea area 2. Las frecuencias y
los porcentajes de las tres lneas areas se muestran en una tabla de frecuencias.
Estadsticos. Tablas de frecuencias que muestran recuentos, porcentajes de respuestas,
578
Captulo 36
Figura 36-3
Cuadro de dilogo Frecuencias de respuestas mltiples
579
Anlisis de respuestas mltiples
menos una vez en los seis ltimos meses (American, United, TWA). Qu considera
ms importante a la hora de seleccionar un vuelo, el horario o el servicio? Seleccione
slo uno. Despus de introducir los datos como dicotomas o categoras mltiples y
combinarlos en un conjunto, puede presentar en forma de tabla de contingencia las
selecciones de lnea area con la pregunta relativa al servicio o al horario.
Estadsticos. Tabla de contingencia con recuentos de casilla, fila, columna y totales,
as como porcentajes de casilla, fila, columna y totales. Los porcentajes de casilla
se basan en casos o respuestas.
Datos. Utilice conjuntos de respuestas mltiples o variables categricas numricas.
Supuestos. Las frecuencias y los porcentajes proporcionan una til descripcin de los
580
Captulo 36
Figura 36-5
Cuadro de dilogo Tablas de contingencia de respuestas mltiples
Si lo desea, puede obtener una tabla de contingencia de doble clasificacin para cada
categora de una variable de control o conjunto de respuestas mltiples. Seleccione
uno o varios elementos para la lista Capas.
Los rangos de valores deben definirse para cualquier variable elemental de la tabla
de contingencia. Introduzca los valores enteros de categora mximos y mnimos
que desee tabular. Las categoras que estn fuera del rango se excluyen del anlisis.
Se entiende que los valores que estn dentro del rango inclusivo son enteros (los
no enteros quedan truncados).
581
Anlisis de respuestas mltiples
Excluir los casos segn lista dentro de las dicotomas. Excluye los casos con
Excluir los casos segn lista dentro de las categoras. Excluye los casos con
582
Captulo 36
Captulo
37
Los listados de casos y los estadsticos descriptivos son herramientas bsicas para
estudiar y presentar los datos. Puede obtener listados de casos con el Editor de
datos o el procedimiento Resumir, frecuencias y estadsticos descriptivos con el
procedimiento Frecuencias, y estadsticos de subpoblacin con el procedimiento
Medias. Cada uno utiliza un formato diseado para que la informacin sea clara. Si
desea ver la informacin con otro formato, las opciones Informe de estadsticos en
filas e Informe de estadsticos en columnas le ofrecen el control que precisa para
presentar los datos.
584
Captulo 37
la columna de datos para cada caso. Esto genera un informe a modo de listado, que
puede ser mucho ms largo que un informe de resumen.
Presentacin preliminar. Muestra slo la primera pgina del informe. Esta opcin
es til para ver una presentacin preliminar del formato del informe sin tener que
procesar el informe completo.
Los datos estn ordenados. Para los informes con variables de ruptura, el archivo de
datos se debe ordenar por los valores de estas variables antes de generar el informe.
Si el archivo de datos ya est ordenado por estos valores, se puede ahorrar tiempo de
procesamiento seleccionando esta opcin. Esta opcin es especialmente til despus
de generar la presentacin preliminar de un informe.
585
Informes de los resultados
Resultados de muestra
Figura 37-1
Informe combinado con listado de los casos y estadsticos de resumen
586
Captulo 37
E Para los informes con estadsticos de resumen para los subgrupos definidos por las
587
Informes de los resultados
Figura 37-3
Cuadro de dilogo Informe: Formato de columna de datos
Los ttulos largos se ajustan de forma automtica dentro de la columna. Utilice la tecla
Intro para insertar manualmente lneas de separacin donde desee ajustar los ttulos.
Posicin de valor en la columna. Para la variable seleccionada, controla la alineacin de
los valores de los datos o de las etiquetas de valor dentro de la columna. La alineacin
de los valores o de las etiquetas no afecta a la alineacin de los encabezados de las
columnas. Puede sangrar el contenido de la columna por un nmero especfico de
caracteres o centrar el contenido.
Contenido de la columna. Para la variable seleccionada, controla la presentacin de los
valores de los datos o de las etiquetas de valor definidas. Los valores de los datos
siempre se muestran para cualquier valor que no tenga etiquetas de valor definidas.
No se encuentra disponible para las columnas de datos en los informes estadsticos
en columnas.
588
Captulo 37
Figura 37-4
Cuadro de dilogo Informe: Lneas de resumen
Los estadsticos de resumen disponibles son: suma, media, valor mnimo, valor
mximo, nmero de casos, porcentaje de casos por encima y por debajo de un
valor especificado, porcentaje de casos dentro de un rango de valores especificado,
desviacin tpica, curtosis, varianza y asimetra.
589
Informes de los resultados
entre las etiquetas o los datos de la categora de ruptura y los estadsticos de resumen.
Esta opcin es especialmente til para los informes combinados que incluyan tanto el
listado de los casos individuales como los estadsticos de resumen para las categoras
de ruptura; en estos informes puede insertar un espacio entre el listado de los casos
y los estadsticos de resumen.
Excluir casos con valores perdidos segn lista. Elimina (del informe) cualquier caso
con valores perdidos para cualquier variable del informe.
Los valores perdidos aparecen como. Permite especificar el smbolo que representa los
valores perdidos en el archivo de datos. Este smbolo slo puede tener un carcter y
se utiliza para representar tanto los valores perdidos del sistema como los valores
perdidos definidos por el usuario.
Numerar las pginas desde la. Permite especificar un nmero de pgina para la
590
Captulo 37
Figura 37-7
Cuadro de dilogo Informe: Diseo
Diseo de pgina. Controla los mrgenes de las pginas expresados en lneas (extremos
superior e inferior) y caracteres (a la izquierda y a la derecha) y la alineacin del
informe entre los mrgenes.
Ttulos y pies de pgina. Controla el nmero de lneas que separan los ttulos y los
591
Informes de los resultados
Si inserta variables en los ttulos o en los pies de pgina, la etiqueta de valor o el valor
de la variable actual aparecer en el ttulo o en el pie de pgina. Para los ttulos se
mostrar la etiqueta de valor correspondiente al valor de la variable al principio de la
pgina; para los pies de pgina, esta etiqueta se mostrar al final de la pgina. Si no
hay etiqueta de valor, se mostrar el valor real.
Variables especiales. Las variables especiales DATE y PAGE permiten insertar la
592
Captulo 37
es til para ver una presentacin preliminar del formato del informe sin tener que
procesar el informe completo.
Los datos estn ordenados. Para los informes con variables de ruptura, el archivo de
datos se debe ordenar por los valores de estas variables antes de generar el informe.
Si el archivo de datos ya est ordenado por estos valores, se puede ahorrar tiempo de
procesamiento seleccionando esta opcin. Esta opcin es especialmente til despus
de generar la presentacin preliminar de un informe.
593
Informes de los resultados
Resultados de muestra
Figura 37-9
Informe de resumen con estadsticos de resumen en columnas
Media
Division
__________
Annual
Age Media Salary
________ ________
Mnimo
Mximo
Annual
Salary
________
Annual
Salary
________
Carpeting
30,75
$11.754
$9.200
$19.500
Appliances
31,11
$12.508
$7.500
$28.300
Furniture
36,87
$13.255
$8.975
$17.050
Hardware
36,20
$17.580
$7.450
$22.500
en la lista de origen y desplcela hasta la lista Columnas de datos varias veces, una
para cada medida que desee obtener.
E Para mostrar una columna con la suma, la media, la razn o cualquier otra funcin
de las columnas existentes, pulse en Insertar total. Al hacerlo se situar una variable
594
Captulo 37
Figura 37-10
Cuadro de dilogo Informe: Estadsticos en las columnas
595
Informes de los resultados
Los estadsticos de resumen disponibles son: suma, media, valor mnimo, valor
mximo, nmero de casos, porcentaje de casos por encima y por debajo de un
valor especificado, porcentaje de casos dentro de un rango de valores especificado,
desviacin tpica, varianza, curtosis y asimetra.
de resumen.
Media de columnas. La columna total es la media de las columnas de la lista Columna
de resumen.
Mnimo de columnas. La columna total es el mnimo de las columnas de la lista
Columna de resumen.
Mximo de columnas. La columna total es el mximo de las columnas de la lista
Columna de resumen.
1 columna 2 columna. La columna total es la resta de las columnas de la lista
596
Captulo 37
dividido por la segunda columna de la lista Columna de resumen. Esta lista debe
contener, exactamente, dos columnas.
Producto de columnas. La columna total es el producto de las columnas de la lista
Columna de resumen.
597
Informes de los resultados
Total final. Muestra y etiqueta un total global para cada columna que aparece al final
de la columna.
Valores perdidos. Permite excluir los valores perdidos del informe o seleccionar un
nico carcter para indicar estos valores.
598
Captulo 37
Insertar lneas de resumen en las columnas de datos para variables que no sean
la variable de la columna de datos o para diversas combinaciones (funciones
compuestas) de las funciones de resumen.
Captulo
Anlisis de fiabilidad
38
Dos mitades. Este modelo divide la escala en dos partes y examina la correlacin
Guttman. Este modelo calcula los lmites inferiores de Guttman para la fiabilidad
verdadera.
Paralelo. Este modelo asume que todos los elementos tienen varianzas iguales y
Paralelo estricto. Este modelo asume los supuestos del modelo paralelo y tambin
600
Captulo 38
Datos. Los datos pueden ser dicotmicos, ordinales o de intervalo, pero deben estar
codificados numricamente.
Supuestos. Las observaciones deben ser independientes y los errores no deben
estar correlacionados entre los elementos. Cada par de elementos debe tener una
distribucin normal bivariada. Las escalas deben ser aditivas, de manera que cada
elemento est linealmente relacionado con la puntuacin total.
Procedimientos relacionados. Si desea explorar la dimensionalidad de los elementos
601
Anlisis de fiabilidad
Puede seleccionar diversos estadsticos que describen la escala y sus elementos. Los
estadsticos de los que se informa por defecto incluyen el nmero de casos, el nmero
de elementos y las estimaciones de la fiabilidad, segn se explica a continuacin:
Descriptivos para. Genera estadsticos descriptivos para las escalas o los elementos a
travs de los casos.
Elemento. Genera estadsticos descriptivos para los elementos a travs de los casos.
602
Captulo 38
cada elemento con la escala compuesta por otros elementos. Los estadsticos
incluyen la media de escala y la varianza si el elemento fuera a eliminarse de la
escala, la correlacin entre el elemento y la escala compuesta por otros elementos,
y alfa de Cronbach si el elemento fuera a eliminarse de la escala.
Resmenes. Proporciona estadsticos descriptivos sobre las distribuciones de los
elementos a travs de todos los elementos de la escala.
elementos.
Tabla de ANOVA. Produce pruebas de medias iguales.
603
Anlisis de fiabilidad
intraclase. Los modelos disponibles son: Dos factores, efectos mixtos; Dos
factores, efectos aleatorios y Un factor, efectos aleatorios. Seleccione Dos
factores, efectos mixtos, si los efectos de personas son aleatorios y los efectos de
elementos son fijos, Dos factores, efectos aleatorios, si los efectos de personas y
los efectos de elementos son aleatorios. Seleccione Un factor, efectos aleatorios si
los efectos de personas son aleatorios.
Tipo. Seleccione el tipo de ndice. Los tipos disponibles son: Los tipos disponibles
604
Captulo 38
Captulo
39
Escalamiento multidimensional
datos de las valoraciones de similaridad emitidas por los sujetos sobre las diferentes
marcas y modelos de coches, puede utilizar el escalamiento multidimensional para
identificar las dimensiones que describan las preferencias de los consumidores. Puede
encontrar, por ejemplo, que el precio y el tamao de un vehculo definen un espacio
de dos dimensiones, capaz de explicar las similaridades de las que informan los
encuestados.
Estadsticos. Para cada modelo: Matriz de datos, Matriz de datos escalada
606
Captulo 39
los estmulos (de dos o tres dimensiones), diagrama de dispersin de las disparidades
frente a las distancias.
Datos. Si los datos son de disimilaridad, todas las disimilaridades deben ser
cuantitativas y deben estar medidas en la misma mtrica. Si los datos son datos
multivariantes, las variables pueden ser datos cuantitativos, binarios o de recuento.
El escalamiento de las variables es un tema importante, ya que las diferencias en el
escalamiento pueden afectar a la solucin. Si las variables tienen grandes diferencias
en el escalamiento (por ejemplo, una variable se mide en dlares y otra en aos),
debe considerar la posibilidad de tipificarlas (este proceso puede llevarse a cabo
automticamente con el propio procedimiento Escalamiento multidimensional).
Supuestos. El procedimiento Escalamiento multidimensional est relativamente
607
Escalamiento multidimensional
Figura 39-1
Cuadro de dilogo Escalamiento multidimensional
E En Distancias, seleccione Los datos son distancias o Crear distancias a partir de datos.
E Si los datos son distancias, seleccione al menos cuatro variables numricas para
el anlisis. (Tambin puede pulsar en Forma para indicar la forma de la matriz de
distancias.)
E Si desea que SPSS cree las distancias antes de analizarlas, seleccione al menos un
valor numrico. (Tambin puede pulsar en Medida para indicar el tipo de medida de
distancia que desea.) Cada variable de agrupacin puede ser numrica o de cadena,
y puede crear matrices distintas para cada categora de una variable de agrupacin
moviendo esa variable a la lista Matrices individuales para.
608
Captulo 39
Seleccione una opcin del grupo Medida que se corresponda con el tipo de datos y, a
continuacin, elija una de las medidas de la lista desplegable correspondiente a ese
tipo de medida. Las opciones disponibles son:
Minkowski o Personalizada.
609
Escalamiento multidimensional
en escalas muy distintas, puede que desee tipificar los valores antes de calcular
las proximidades (no es aplicable a datos binarios). Seleccione un mtodo
de estandarizacin en la lista desplegable Estandarizar. Si no se requiere la
estandarizacin, seleccione Ninguno.
610
Captulo 39
Grficos de grupo, Grficos para los sujetos individuales, Matriz de datos y Resumen
del modelo y de las opciones.
Criterios. Permite determinar cundo debe detenerse la iteracin. Para cambiar los
valores por defecto, introduzca valores para la Convergencia de s-stress, el Valor
mnimo de s-stress y el N mximo de iteraciones.
611
Escalamiento multidimensional
Tratar distancias menores que n como perdidas. Las distancias menores que este valor
Captulo
Estadsticos de la razn
40
precio de venta de viviendas en cada una de las cinco regiones? En los resultados,
se puede descubrir que la distribucin de las razones vara considerablemente entre
regiones.
Estadsticos. Mediana, media, media ponderada, intervalos de confianza, coeficiente
614
Captulo 40
Figura 40-1
Cuadro de dilogo Estadsticos de la razn
Elija si desea guardar los resultados en un archivo externo para un uso posterior y
especificar el nombre del archivo en el que se van a guardar los resultados.
615
Estadsticos de la razn
Estadsticos de la razn
Figura 40-2
Cuadro de dilogo Estadsticos de la razn
Tendencia central. Las medidas de tendencia central son estadsticos que describen
Mediana. Un valor tal que el nmero de razones menores que este valor es igual al
total de razones.
616
Captulo 40
cuadrticas de las razones respecto a la media, dividir la suma por el nmero total
de razones menos uno y extraer la raz cuadrada positiva.
especificando los valores superior e inferior del intervalo. Introduzca valores para
las proporciones superior e inferior y pulse en Aadir para obtener un intervalo.
Captulo
41
Se pueden crear grficos de alta resolucin mediante los procedimientos del men
Grficos y mediante muchos de los procedimientos del men Analizar. Este captulo
explica los conceptos bsicos de la utilidad de grficos.
617
618
Captulo 41
Figura 41-1
Cuadro de dilogo Generador de grficos
619
Conceptos bsicos de la utilidad de grficos
E Arrastre las variables desde la lista Variables a las zonas de arrastre del eje. (Si desea
obtener ms informacin acerca del generador de grficos, pulse en Ayuda.)
E Si necesita cambiar los estadsticos o modificar los atributos de los ejes o las leyendas,
pulse en Propiedades del elemento.
620
Captulo 41
Figura 41-3
Ventana Propiedades del elemento
E En la lista Editar propiedades de, seleccione el elemento que desea cambiar. (Si desea
obtener informacin acerca de propiedades especficas, pulse en Ayuda.)
E Pulse en Aceptar en el cuadro de dilogo Generador de grficos para crear el grfico.
621
Conceptos bsicos de la utilidad de grficos
Figura 41-4
Grfico de barras en la ventana Visor
Modificacin de grficos
Para modificar un grfico, pulse dos veces en cualquier parte del grfico que aparece
en el Visor. Al hacer esto, aparecer el grfico en el Editor de grficos.
622
Captulo 41
Figura 41-5
Grfico original en el Editor de grficos
Puede modificar cualquier parte del grfico o cambiar a otro tipo de grfico que
represente los mismos datos. Puede aadir elementos, as como ocultarlos o
mostrarlos utilizando los mens del Editor de grficos.
Para modificar un elemento de un grfico
E Seleccione el elemento que desea modificar.
E Elija en los mens:
Edicin
Propiedades...
623
Conceptos bsicos de la utilidad de grficos
Figura 41-6
Ventana Propiedades
624
Captulo 41
Figura 41-7
Grfico modificado
625
Conceptos bsicos de la utilidad de grficos
Opciones
El cuadro de dilogo Opciones ofrece una serie de opciones para el grfico que va a
crear. Este cuadro de dilogo est disponible si pulsa en Opciones.
626
Captulo 41
Figura 41-8
Cuadro de dilogo Opciones
Valores perdidos
Variables de segmentacin
Si hay valores perdidos en los datos para las variables que se utilizan para definir
categoras o subgrupos, seleccione Incluir para que la categora o categoras de los
valores perdidos definidos por el usuario (valores identificados como perdidos por el
usuario) se incluyan en el grfico. Estas categoras tambin actan como variables de
segmentacin para calcular el estadstico. Las categoras perdidos aparecen en el
eje de categoras o en la leyenda, aadiendo, por ejemplo, una barra adicional o un
627
Conceptos bsicos de la utilidad de grficos
Puede seleccionar una de las siguientes alternativas para excluir los casos que
contienen valores perdidos:
Excluir segn lista para obtener una base de casos coherente para el grfico. Si
alguna de las variables del grfico tiene un valor perdido para un determinado
caso, se excluir el caso completo del grfico.
Excluir por variable para maximizar el uso de los datos. Si una variable seleccionada
tiene algn valor perdido, los casos que tengan estos valores perdidos se excluirn
al analizar dicha variable.
Para ver la diferencia existente entre la exclusin por lista y la exclusin por variables
de los valores perdidos, observe las siguientes figuras, que muestran un grfico de
barras para cada una de las dos opciones.
Figura 41-9
Exclusin por lista de los valores perdidos
628
Captulo 41
Figura 41-10
Exclusin por variables de los valores perdidos
Estos grficos se crearon a partir de una versin del archivo Employee data.sav que se
edit para que tuviese algunos valores perdidos por el sistema (en blanco) para las
variables correspondientes al salario actual y a la categora laboral. En otros casos, se
introdujo el valor 0 y se defini como perdido. En ambos grficos, se ha seleccionado
la opcin Mostrar los grupos definidos por los valores perdidos, que aade la categora
Perdidos al resto de las categoras laborales mostradas. En cada grfico, los valores de
la funcin de resumen, Nmero de casos, se muestran en las etiquetas de las barras.
En ambos grficos, 26 casos tienen un valor perdido del sistema para la categora
laboral y 13 casos tienen el valor perdido definido por el usuario (0). En el grfico
por lista, el nmero de casos es el mismo para ambas variables en cada agrupacin
de barras ya que siempre que haba un valor perdido se excluy el caso de todas
las variables. En el grfico por variables, el nmero de casos no perdidos de cada
variable de una categora se representa sin tener en cuenta los valores perdidos en
las otras variables.
Plantillas grficas
Puede aplicar muchos de los atributos y elementos de texto de un grfico a otro. Esta
posibilidad permite modificar un grfico, guardar dicho grfico como una plantilla y
utilizar posteriormente dicha plantilla para crear una serie de grficos similares.
629
Conceptos bsicos de la utilidad de grficos
Para utilizar una plantilla al crear un grfico, pulse en Aadir en el grupo Plantillas.
Se abrir un cuadro de dilogo estndar de seleccin de archivos. Si aade varias
plantillas, stas se aplican siguiendo el orden en el que aparecen en la lista Archivos
de plantilla. Si lo desea, puede cambiar el orden.
Para aplicar una plantilla a un grfico que ya se encuentra en el Editor de grficos,
elija en los mens:
Archivo
Aplicar plantilla grfica...
grfico que desea guardar en la plantilla. La ayuda en pantalla describe con detalle
las opciones disponibles.
630
Captulo 41
E Pulse en Continuar.
E Escriba el nombre del archivo y la ubicacin de la nueva plantilla. La extensin de
la plantilla es .sgt.
Captulo
42
Curvas COR
631
632
Captulo 42
Figura 42-1
Resultados de curvas COR
633
Curvas COR
634
Captulo 42
positiva.
Parmetros para el error tpico del rea. Permite especificar el mtodo de estimacin
del error tpico del rea situada bajo la curva. Los mtodos disponibles son el no
paramtrico y el exponencial binegativo. Tambin se puede establecer el nivel para el
intervalo de confianza. El rango disponible es entre el 50,1% y el 99,9%.
Valores perdidos. Permite especificar el tratamiento que reciben los valores perdidos.
Captulo
43
Utilidades
En este captulo se describen las funciones del men Utilidades as como las opciones
para posibilidad de reordenar las listas de variables de destino usando los mens
de sistema de Windows.
Formato de datos
Etiqueta de variable
Etiquetas de valor
Figura 43-1
Cuadro de dilogo Variables
636
Captulo 43
sintaxis designada.
Para modificar la definicin de una variable, utilice la Vista de variables en el Editor
de datos.
Para obtener informacin sobre la variable
E Elija en los mens:
Utilidades
Variables...
E Seleccione la variable cuya informacin de definicin desee mostrar.
Los comentarios admiten cualquier longitud, aunque estn limitados a 80 bytes (por
regla general, 80 caracteres en idiomas de un solo byte) por lnea; las lneas se dividen
automticamente en 80 caracteres. Los comentarios se muestran en la misma fuente
que los resultados de texto para reflejar de forma precisa el modo en que aparecen al
mostrarlos en el Visor.
Se aade de forma automtica una anotacin de fecha (la fecha actual entre
parntesis) al final de la lista de comentarios siempre que se aaden o modifican los
comentarios. Esto puede dar lugar a cierta ambigedad por lo que respecta a las
fechas asociadas a los comentarios si modifica un comentario existente o introduce
un comentario nuevo entre los comentarios existentes.
637
Utilidades
Conjuntos de variables
Puede restringir las variables que aparecen en las listas de variables de origen
de un cuadro de dilogo, definiendo y utilizando los conjuntos de variables. Es
especialmente til en archivos de datos con un amplio nmero de variables. Los
conjuntos de variables pequeos hacen que la bsqueda y la seleccin de variables
para los anlisis sea ms fcil y pueden incluso mejorar el rendimiento. Si el archivo
de datos contiene un elevado nmero de variables y cuadros de dilogo que se abren
con lentitud, restringir las listas de origen de un cuadro de dilogo a subconjuntos de
variables ms pequeos reducira la cantidad de tiempo empleado en abrirlos.
Nombre del conjunto. Los nombres de los conjuntos pueden tener hasta 12 caracteres.
Puede utilizar cualquier carcter, incluso los espacios en blanco. Los nombres de los
conjuntos no distinguen maysculas de minsculas.
638
Captulo 43
Usar conjuntos
El cuadro de dilogo Usar conjuntos restringe las variables mostradas en las listas de
origen de los cuadros de dilogo a los conjuntos seleccionados que haya definido.
Figura 43-3
Cuadro de dilogo Usar conjuntos
639
Utilidades
la sesin.
Puede eliminar estos conjuntos de la lista y seleccionar otros, si bien debe haber al
menos un conjunto en la lista. Si no elimina el conjunto ALLVARIABLES de la lista
Conjuntos en uso, cualquier otro conjunto que incluya no tendr efecto alguno.
Para restringir las listas de origen de los cuadros de dilogo a los conjuntos de variables
definidos
E Elija en los mens:
Utilidades
Usar conjuntos...
E Seleccione los conjuntos de variables definidos que contengan las variables que desee
640
Captulo 43
Figura 43-4
Para acceder al mismo, pulse en la esquina superior izquierda del cuadro de dilogo).
Men de sistema de Windows con reordenacin de la lista de destino
la lista de destino.
Puede mover mltiples variables simultneamente si son contiguas (es decir, si estn
agrupadas unas junto a otras). No es posible mover grupos de variables no contiguas.
Captulo
44
Opciones
El orden en que aparecen las variables en las listas de origen de los cuadros de
dilogo
Aspecto de tabla para las nuevas tablas pivote y Aspecto de grfico para los
nuevos grficos interactivos
641
642
Captulo 44
General: Opciones
Figura 44-1
Pestaa general del cuadro de dilogo Opciones
643
Opciones
644
Captulo 44
645
Opciones
Estado inicial de los resultados. Controla los elementos que se muestran y se ocultan
automticamente cada vez que se ejecuta un procedimiento, adems de la alineacin
inicial de los elementos. Puede controlar la presentacin de los siguientes elementos:
registro, advertencias, notas, ttulos, tablas pivote, grficos y resultados de texto (los
resultados no se muestran en las tablas pivote). Tambin se puede activar o desactivar
la muestra de los comandos en el registro. Se pueden copiar comandos de sintaxis
del registro y guardarlos en un archivo de sintaxis para utilizarlos con la utilidad de
produccin automtica.
646
Captulo 44
Figura 44-3
Pestaa Visor de borrador del cuadro dilogo Opciones
las fuentes de paso fijo (monoespaciadas) porque los resultados de texto separados
por espacios no pueden alinearse correctamente si se emplea una fuente proporcional.
647
Opciones
Resultados tabulares. Controla las opciones de los resultados de las tablas pivote
648
Captulo 44
Figura 44-4
Pestaa Etiquetas de los resultados del cuadro de dilogo Opciones
Las opciones de etiquetas de los resultados afectan slo a los nuevos resultados que se
producen despus de cambiar las selecciones. A los resultados que ya se muestran
en el Visor no les afectan los cambios en la configuracin. Esta configuracin slo
afecta a los resultados de las tablas pivote. Los resultados de texto no se vern
afectados por estas selecciones.
649
Opciones
Opciones de grfico
Figura 44-5
Pestaa Grficos del cuadro de dilogo Opciones
Plantilla grfica. Los grficos nuevos pueden utilizar tanto las opciones seleccionadas
aqu, como las opciones de un archivo de plantilla grfica. Pulse en Examinar para
seleccionar un archivo de plantilla grfica. Para crear un archivo de plantilla grfica,
cree un grfico con los atributos que desee y gurdelo como una plantilla (seleccione
Guardar plantilla grfica en el men Archivo).
Relacin de aspecto de los grficos. La relacin ancho-alto del marco exterior de los
nuevos grficos. Puede especificar una relacin ancho-alto entre los valores 0,1 y
10,0. Los valores inferiores a 1 generan grficos que son ms altos que anchos. Los
valores mayores que 1 producen grficos que son ms anchos que altos. Un valor de
1 produce un grfico cuadrado. Una vez creado un grfico, no es posible cambiar
su relacin de aspecto.
650
Captulo 44
Ejecutar JVM al iniciar. Las funciones de los grficos requieren la mquina virtual
Java (JVM). Por defecto, la JVM se lanza cuando se inicia una sesin de SPSS. Si
anula la seleccin (desactiva) de esta opcin, SPSS se iniciar ms rpido, pero se
producirn pequeos retrasos al lanzar la JVM la primera vez que utilice el generador
de grficos o cree un grfico en una sesin.
Fuente. La fuente utilizada para todo el texto en los nuevos grficos.
Preferencia de ciclos de estilo. La asignacin inicial de colores y tramas para nuevos
grficos. Mostrar sucesivamente slo los colores utiliza nicamente colores para
diferenciar los elementos grficos y no utiliza tramas. Mostrar sucesivamente slo las
tramas slo utiliza estilos de lnea, smbolos de marcador o tramas de relleno para
diferenciar los elementos grficos y no utiliza color.
Marco. Controla la presentacin de los marcos interno y externo en los nuevos
grficos.
Lneas de cuadrcula. Controla la presentacin de las lneas de cuadrcula de los ejes
tramas de relleno para los grficos nuevos. Puede cambiar el orden de los colores o
tramas utilizados al crear un grfico nuevo.
Nota: Estas opciones no afectan a los grficos interactivos (men Grficos, submen
Interactivo).
651
Opciones
con categoras. Para cambiar el estilo de lnea de una categora, seleccinela y elija
un estilo de lnea en la paleta para dicha categora.
652
Captulo 44
Si lo desea, puede:
653
Opciones
categoras. Para cambiar la trama de relleno de una categora, seleccinela y elija una
trama de relleno en la paleta para dicha categora.
Si lo desea, puede:
654
Captulo 44
655
Opciones
Datos guardados con el grfico. Controla la informacin que se guarda con los
grficos interactivos cuando dejan de estar anexados al archivo de datos que los
cre (por ejemplo, si abre un archivo del Visor guardado en una sesin anterior).
El almacenamiento de los datos con el grfico permite utilizar la mayora de las
funciones interactivas disponibles para los grficos anexados al archivo de datos que
los cre (exceptuando la adicin de variables no incluidas en el grfico original). Sin
embargo, esta opcin puede aumentar considerablemente el tamao de los archivos
del Visor, especialmente el de los archivos de datos de gran tamao.
Resolucin de impresin. Determina la resolucin de impresin de los grficos
Nota: Con la excepcin del nivel de medida, estas opciones slo afectan a los grficos
interactivos (men Grficos, submen Interactivo).
656
Captulo 44
Figura 44-7
Pestaa Tablas pivote del cuadro de dilogo Opciones
directorio Looks del directorio donde se instal el programa. Puede utilizar uno de
los aspectos de tabla que se incluye en SPSS, o bien crear uno propio en el editor de
tablas pivote (men Formato, Aspectos de tabla).
por defecto.
Ajustar los anchos de columna para. Controla el ajuste automtico de los anchos de
657
Opciones
del Visor o en una ventana independiente. Por defecto, cuando se pulsa dos veces
en una tabla pivote, sta se activa en la ventana del Visor. Puede elegir entre activar
las tablas pivote en una ventana independiente o seleccionar una opcin de tamao
que abra las tablas pivote ms pequeas en la ventana del Visor y las ms grandes
en una ventana independiente.
658
Captulo 44
Datos: Opciones
Figura 44-8
Pestaa Datos del cuadro de dilogo Opciones
Opciones de transformacin y fusin. Cada vez que SPSS ejecuta un comando, lee
por defecto del ancho y el nmero de posiciones decimales de las nuevas variables
numricas. No existe formato de presentacin por defecto para las nuevas variables de
cadena. Si un valor es demasiado largo para el formato de presentacin especificado,
primero se redondean las posiciones decimales y despus los valores se convierten a
notacin cientfica. Los formatos de presentacin no afectan a los valores de datos
659
Opciones
disponibles:
Moneda: Opciones
Puede crear hasta cinco formatos de presentacin de moneda personalizados que
pueden incluir caracteres de prefijo y sufijo especiales adems de un tratamiento
especial para los valores negativos.
Los nombres de los cinco formatos de moneda personalizados son MPA, MPB,
MPC, CCD y MPE. No se pueden cambiar los nombres de los formatos ni aadir
otros nuevos. Para modificar un formato de moneda personalizado, seleccione el
nombre del formato de la lista de origen y realice los cambios que desee.
660
Captulo 44
Figura 44-9
Pestaa Moneda del cuadro de dilogo Opciones
Los prefijos, los sufijos y los separadores decimales definidos para los formatos
monetarios personalizados slo afectan a la presentacin en la pantalla. No es
posible introducir valores en el Editor de datos utilizando caracteres de moneda
personalizados.
661
Opciones
Procesos: Opciones
Utilice la pestaa Procesos para especificar el archivo de procedimientos global y el
archivo de autoproceso, y para seleccionar las subrutinas de autoproceso que desee
utilizar. Puede utilizar procesos para automatizar muchas funciones, incluyendo la
personalizacin de tablas pivote.
Procedimientos globales. Un archivo de procedimientos globales es una biblioteca de
subrutinas de proceso y funciones que pueden ser invocadas por archivos de proceso,
incluyendo los archivos de autoproceso.
Nota: los procedimientos globales que acompaan al programa son los que aparecen
seleccionados por defecto. Muchos de los procesos que se ofrecen utilizan funciones
y subrutinas de este archivo de procedimientos global y no funcionarn si se especifica
un archivo de procedimientos diferente.
Autoprocesos. Un archivo de autoproceso es un conjunto de subrutinas de proceso
que se ejecutan automticamente cada vez que se ejecutan procedimientos que crean
ciertos tipos de objetos de resultados.
662
Captulo 44
Figura 44-10
Pestaa Procesos del cuadro de dilogo Opciones
Muestra todas las subrutinas del archivo de autoprocesos actual, permitiendo activar y
desactivar subrutinas individuales.
Captulo
Personalizacin de mens y
barras de herramientas
45
Editor de mens
Puede personalizar los mens utilizando el Editor de mens. Con el Editor de mens
es posible:
Aadir elementos de men que ejecuten otras aplicaciones y enven los datos
automticamente a otras aplicaciones.
Puede enviar datos a otras aplicaciones en los siguientes formatos: SPSS, Excel 4.0,
Lotus 1-2-3 versin 3, SYLK, delimitado por tabuladores y dBASE IV.
664
Captulo 45
E Pulse en Examinar para seleccionar un archivo que sea anexionado al elemento de
men.
Figura 45-1
Cuadro de dilogo Editor de mens
665
Personalizacin de mens y barras de herramientas
herramientas, seleccione las ventanas en las que desea que aparezca y pulse en
Personalizar.
E Seleccione un elemento en la lista Categoras para que se visualicen las herramientas
en el cuadro de dilogo.
666
Captulo 45
E Para eliminar una herramienta de la barra de herramientas, arrstrela a cualquier punto
herramienta.
Las nuevas herramientas se muestran en la categora Personales, que adems contiene
los elementos de men definidos por el usuario.
667
Personalizacin de mens y barras de herramientas
668
Captulo 45
669
Personalizacin de mens y barras de herramientas
Figura 45-6
Editor de mapa de bits
Captulo
Unidad de produccin
46
671
672
Captulo 46
Figura 46-1
Unidad de produccin
para el trabajo:
Interactivo. Cada comando debe finalizar con un punto. Los puntos pueden
Lote. Cada comando debe comenzar al principio de una lnea nueva (sin espacios
en blanco antes del inicio del comando) y las lneas de continuacin se deben
sangrar como mnimo un espacio. Si desea sangrar comandos nuevos, puede
utilizar un signo ms o un punto como primer carcter al inicio de la lnea y, a
continuacin, sangrar el comando. El punto del final del comando es opcional.
Este ajuste es compatible con las reglas de sintaxis para los archivos de comandos
incluidos con el comando INCLUDE.
673
Unidad de produccin
resultados con el mismo nombre que el trabajo de produccin y la extensin .spo. Por
ejemplo, un archivo de trabajo de produccin llamado trabprod.spp crear un archivo
de resultados llamado trabprod.spo. El archivo de resultados es un documento del
Visor.
Tipos de resultados. Los resultados del Visor generan tablas pivote y grficos
interactivos de alta resolucin. Los resultados del Visor de borrador producen
resultados de texto e imgenes de metarchivo de grficos. Los resultados de texto se
pueden editar en el Visor de borrador, pero no los grficos.
674
Captulo 46
Opciones de exportacin
Exportar resultados guarda las tablas pivote y los resultados de texto en formato
HTML, de texto, Word/RTF y Excel y guarda los grficos en una amplia variedad
de formatos comunes utilizados por otras aplicaciones.
Figura 46-2
Cuadro de dilogo de opciones de exportacin
Exportar
de texto y grficos.
Para los formatos Word o RTF, los grficos se exportan en formato de metarchivo
de Windows y se incrustan en el documento de Word.
675
Unidad de produccin
Para los documentos de resultados, las opciones disponibles son HTML, texto,
Word/RTF y Excel; para los formatos HTML y de texto, los grficos se exportan en
el formato de grfico seleccionado actualmente. Para Slo grficos, seleccione un
formato de exportacin del grfico en la lista desplegable. Para exportar documentos
de resultados, tablas pivote y texto, siga las instrucciones siguientes:
Archivo HTML (*.htm). Las tablas pivote se exportan como tablas HTML. Los
Archivo de texto (*.txt). Las tablas pivote se pueden exportar en formato separado
Archivo de Excel (*.xls). Las filas, columnas y casillas de tablas pivote se exportan
como filas, columnas y casillas de Excel, con todos los atributos de formato
intactos (por ejemplo, bordes de casilla, estilos de fuente, colores de fondo, etc.).
Los resultados de texto se exportan con todos los atributos de fuente intactos.
Cada lnea del resultado de texto constituye una fila del archivo de Excel y se
incluye todo su contenido en una sola casilla.
Archivo de Word/RTF (*.doc). Las tablas pivote se exportan como tablas de Word,
con todos los atributos de formato intactos (por ejemplo, bordes de casilla,
estilos de fuente, colores de fondo, etc.). Los resultados de texto se exportan en
formato RTF. Los resultados de texto siempre se muestran en SPSS con un tipo
de letra de paso fijo (monoespaciadas) y se exportan con los mismos atributos
de fuente. Es necesario utilizar una fuente de paso fijo para que los resultados
de texto separado por espacios queden correctamente alineados; por defecto, la
mayora de los navegadores de Web utilizan una fuente de paso fijo para el texto
con formato previo.
Formato de imagen
676
Captulo 46
Las opciones de exportacin de texto (por ejemplo, separado por tabuladores o por
espacios) y las opciones de exportacin de grficos (como el color, el tamao y la
resolucin) estn predefinidas en SPSS y no se pueden cambiar en la Unidad de
produccin. Utilice la opcin Exportar del men Archivo en SPSS para modificarlas.
Exportacin del Visor de borrador
El Visor de borrador slo permite exportar los resultados en formato de slo texto.
No se pueden exportar los grficos de los resultados.
677
Unidad de produccin
Figura 46-3
Cuadro de dilogo de entradas del usuario
678
Captulo 46
debe escribir Yes (S) ya que las especificaciones de nombres de archivos deben ir
entre comillas.
Figura 46-4
Entradas de macro en un archivo de sintaxis de comandos
679
Unidad de produccin
Figura 46-5
Cuadro de dilogo de solicitud de entrada del usuario para las macros de produccin
Nota: Estos smbolos de macro no guardan relacin con las macros creadas
mediante la funcin de macros de SPSS usando DEFINE-!ENDDEFINE, y el trabajo
de produccin informar de estos valores incluso cuando ninguno de los archivos de
sintaxis de comandos en el trabajo incluyan referencias a las macros definidas.
Opciones de produccin
Las opciones de produccin permiten:
Especificar un editor de textos por defecto para los archivos de sintaxis a los que
se accede mediante el botn Edit (Editar) del cuadro de dilogo principal.
680
Captulo 46
Figura 46-6
Cuadro de dilogo Opciones
pivote activada), podr controlar muchos de los atributos de las tablas pivote. Puede
especificar tamaos y estilos de fuente, colores y bordes. Para asegurarse de que las
tablas anchas no se dividen en varias pginas, seleccione Reducir tabla ancha para
caber en la pgina en la pestaa Impresin del cuadro de dilogo Propiedades de tabla.
681
Unidad de produccin
682
Captulo 46
E Pulse en Guardar aspecto o en Guardar como para guardar el aspecto de tabla y,
despus, en Aceptar.
E Elija en los mens:
Edicin
Opciones...
E Pulse en la pestaa Tablas pivote.
E Elija el aspecto de tabla en la lista y pulse en Aceptar.
Puede definir el Aspecto de tabla por defecto, las opciones de las etiquetas de los
resultados y el ajuste automtico del ancho de columna en el cuadro de dilogo
Opciones. Los ajustes realizados en Opciones se guardarn con el programa. Cuando
se ejecuta un trabajo de produccin, se aplican los ajustes de Opciones vigentes la
ltima vez que se ejecut el programa.
como en:
SET TVARS = BOTH muestra tanto los nombres como las etiquetas de variable.
683
Unidad de produccin
SET ONUMBER. Controla la presentacin de los valores de los datos o las etiquetas de
valor en las nuevas tablas pivote.
SET ONUMBER = BOTH muestra los valores de datos y las etiquetas de valor.
SET TFIT. Controla el ajuste automtico del ancho de columna para las nuevas tablas
pivote.
la columna.
684
Captulo 46
685
Unidad de produccin
Si utiliza un archivo por lotes (.bat) o una unidad similar para ejecutar varios trabajos
de produccin, utilice el comando Start de Windows con el modificador /wait
para controlar la ejecucin de cada trabajo e impedir as que los trabajos posteriores
se inicien antes de que finalice el trabajo anterior como ocurre en:
cd \program files\spss
start /wait spssprod.exe prodjob1.spp -s
start /wait spssprod.exe prodjob2.spp -s
Publicar en Web
La opcin Publicar en Web exporta los resultados al servidor web SmartViewer para
su publicacin. Las tablas e informes publicados en SmartViewer se pueden visualizar
y manipular a travs de la Web, en tiempo real utilizando un explorador estndar.
Las tablas pivote se publican como tablas dinmicas que se pueden manipular a
travs de la Web para obtener diferentes vistas de los datos.
Los resultados de texto se publican como formato previo de HTML. (Por defecto,
la mayora de los navegadores Web utilizan un tipo de letra de anchura fija para
mostrar el texto con formato.)
Documento de salida (sin notas). Publica todo excepto la tabla de notas que se
Slo tablas. Excluye los grficos. Se publicarn todas las tablas pivote y todas
Slo tablas (sin notas). Excluya los grficos y las tablas de notas.
Nada. Desactiva la publicacin en Web. Ya que todos los ajustes se guardan con
686
Captulo 46
Interactivo. Las tablas son objetos dinmicos que se pueden manipular desde la
publicacin.
Configurar. Abre la pgina Configurar publicacin automtica del servidor web
SmartViewer en una ventana del navegador. Se requiere cuando se crea un nuevo
trabajo de produccin para publicar en la Web.
Tambin es necesario una identificacin de usuario y una contrasea para acceder
al servidor web SmartViewer. Cuando cree un nuevo trabajo de produccin para
publicar en la Web, se le solicitar una identificacin de usuario y una contrasea.
Esta informacin se almacena en el trabajo de produccin con un formato encriptado.
Nota: Publicar en web slo est disponible para sitios que tengan instalado el
servidor web SmartViewer y es necesario un complemento para activar la funcin de
publicacin. Pngase en contacto con su administrador del sistema o administrador
del servidor web para obtener instrucciones sobre la descarga del complemento. Si
SmartViewer no est disponible en su sitio web, utilice Exportar resultados para
guardar los resultados en formato HTML.
Captulo
Utilidad de procesamiento de
SPSS
47
Con el programa se incluyen varios procesos, entre ellos algunos autoprocesos que
se ejecutan automticamente siempre que se produce un tipo concreto de resultado.
Puede utilizar estos procesos tal y como son o personalizarlos segn sus necesidades.
Si desea crear sus propios procesos, puede empezar por elegir entre un nmero de
procesos de iniciacin.
687
688
Captulo 47
Figura 47-1
Cuadro de dilogo Ejecutar proceso
Antes de ejecutar el proceso el documento debe estar abierto en la ventana del Visor
designada.
689
Utilidad de procesamiento de SPSS
Pie de pgina frec. Inserta los estadsticos mostrados en una tabla de estadsticos de
frecuencias como notas al pie en la tabla de frecuencias correspondiente para cada
variable. Antes de ejecutar el proceso se debe seleccionar la tabla de estadsticos
de frecuencia.
Totales en negrita. Aplica el formato negrita y el color azul a cualquier fila, columna
o capa de datos con la etiqueta Total en una tabla pivote. Se debe seleccionar la
tabla antes de ejecutar el proceso.
Informe de medias. Extrae informacin de una tabla Medias y escribe los resultados en
Autoprocesos
Los autoprocesos se ejecutan automticamente al ser activados cuando se crea una
pieza especfica de resultados con un procedimiento dado. Por ejemplo, uno de los
autoprocesos elimina automticamente la diagonal superior y resalta los coeficientes
de correlacin inferiores a una significacin determinada siempre que se genera una
tabla de correlaciones mediante el procedimiento Correlaciones bivariadas.
La pestaa Procesos del cuadro de dilogo Opciones (men Edicin) muestra
los autoprocesos que estn disponibles en el sistema y permite activar o desactivar
procesos individuales.
690
Captulo 47
Figura 47-2
Pestaa Procesos del cuadro de dilogo Opciones
691
Utilidad de procesamiento de SPSS
Si prefiere crear sus propios procesos, puede comenzar eligiendo entre varios
procesos iniciales.
692
Captulo 47
Figura 47-4
Apertura de un archivo de autoproceso
Ventana de proceso
La ventana de proceso es un entorno de programacin completo que utiliza el
lenguaje Sax BASIC e incluye un editor de cuadros de dilogo, un Visor de objetos,
funciones de depuracin y ayuda sensible al contexto.
693
Utilidad de procesamiento de SPSS
Figura 47-5
Ventana de proceso
Los trminos en color azul son palabras reservadas en BASIC (por ejemplo,
Sub, End Sub y Dim). Puede acceder a la ayuda sensible al contexto para estos
trminos pulsando en ellos y, a continuacin, en F1.
694
Captulo 47
Procesos de iniciacin
Si desea crear un proceso nuevo, puede comenzar eligiendo uno de los diversos
procesos de iniciacin que se ofrecen.
695
Utilidad de procesamiento de SPSS
Figura 47-7
Cuadro de dilogo Utilizar proceso de iniciacin
criterios.
Pie de pgina. Vuelve a dar formato a una nota al pie de una tabla pivote, modifica el
696
Captulo 47
Adems, puede utilizar cualquiera de los otros procesos disponibles como procesos
de iniciacin, aunque quizs no sea tan fcil personalizarlos. Slo tiene que abrir el
proceso y guardarlo con un nombre de archivo diferente.
Creacin de autoprocesos
La creacin de un autoproceso empieza por el objeto de resultados que se desea
utilizar como desencadenante. Por ejemplo, para crear un autoproceso que se ejecute
siempre que se produzca una tabla de frecuencias, genere una tabla de frecuencias de
la manera habitual y pulse en la tabla en el Visor para seleccionarla. A continuacin,
pulse con el botn derecho del ratn o srvase del men Utilidades para crear un
nuevo autoproceso que se active al generar ese tipo de tabla.
Figura 47-8
Creacin de un nuevo autoproceso
697
Utilidad de procesamiento de SPSS
698
Captulo 47
699
Utilidad de procesamiento de SPSS
Archivo de autoproceso
Todos los autoprocesos se guardan en un nico archivo (a diferencia de otros procesos
que se guardan en archivos diferentes). Tambin se aade a este archivo cualquier
autoproceso nuevo que se crea. El nombre del archivo de autoproceso actual se
muestra en la pestaa Procesos del cuadro de dilogo Opciones (men Edicin).
Figura 47-11
Subrutinas de autoproceso mostradas en el cuadro de dilogo Opciones
El cuadro de dilogo Opciones tambin muestra todos los autoprocesos del archivo de
autoproceso actualmente seleccionado, permitindole activar o desactivar procesos
individuales.
700
Captulo 47
701
Utilidad de procesamiento de SPSS
Declaracin de variables
Aunque no siempre es necesario, es una buena idea declarar todas las variables antes
de utilizarlas. Esto se realiza principalmente empleando instrucciones de declaracin
Dim:
702
Captulo 47
convenciones (puede dar a sus variables el nombre que desee), pero si las sigue,
resultar ms fcil entender su cdigo.
Clases de objetos de SPSS. ISpssOutputDoc y PivotTable son nombres de clases
de objetos de SPSS. Cada clase representa un tipo de objeto que SPSS puede crear,
tales como un documento de resultados o una tabla pivote. Adems cada una de estas
clases posee propiedades y mtodos especficos asociados a ella. El conjunto de todas
las clases (o tipos) de objetos de SPSS se conoce como biblioteca de tipos de SPSS.
Tipo o Clase
Nombre de variable
Aplicacin de SPSS
IspssApp
objSpssApp, la variable es
global y no
requiere declaracin
Opciones de SPSS
ISpssOptions
objSpssOptions
Informacin de archivo de
SPSS
Documentos
IspssInfo
objSpssInfo
ISpssDocuments
objDocuments
Documento de datos
ISpssDataDoc
objDataDoc
Documento de sintaxis
ISpssSyntaxDoc
objSyntaxDoc
ISpssOutputDoc
objOutputDoc
ISpssPrintOptions
objPrintOptions
Opciones de impresin
objOutputItems
resultados
Elemento de resultados ISpssItem
objOutputItem
Grfico
ISpssChart
objSPSSChart
Texto
ISpssRtf
objSPSSText
Tabla pivote
PivotTable
objPivotTable
703
Utilidad de procesamiento de SPSS
Objeto
Tipo o Clase
Nombre de variable
Notas al pie
ISpssFootnotes
objFootnotes
Casillas de datos
ISpssDataCells
objDataCells
Etiquetas de capa
ISpssLayerLabels
objLayerLabels
Etiquetas de columna
ISpssLabels
objColumnLabels
Etiquetas de fila
ISpssLabels
objRowLabels
objPivotMgr
objDimension
704
Captulo 47
Sub Main
Dim objOutputDoc As ISpssOutputDoc'Declara las variables del objeto
Dim objOutputItems As ISpssItems
Dim objOutputItem As ISpssItem
Set objOutputDoc = objSpssApp.GetDesignatedOutputDoc'Obtiene referencia para el documento de
resultados designado
Set objOutputItems = objOutputDoc.Items() 'Obtiene la coleccin de elementos del documento
Set objOutputItem = objOutputItems.GetItem(2) 'Obtiene el tercer elemento de resultados
'(los nmeros de elemento empiezan en 0, as que "2" corresponde al tercero)
objOutputItem.Activate 'Activa el elemento de resultados
End sub
705
Utilidad de procesamiento de SPSS
Set objPivotTable = objOutputItem.Activate()'si el elemento es una tabla pivote, actvela
Exit For
End If
Next index
End sub
Propiedad
Mtodo
Dureza
Color
TextFont
DataCellWidths
CaptionText
Escribir
Borrar
SelectTable
ClearSelection
HideFootnotes
706
Captulo 47
Visor de objetos
El Visor de objetos muestra todas las clases de objetos y los mtodos y propiedades
asociados a cada una. Tambin puede acceder a la ayuda sobre propiedades y mtodos
especficos y pegar los que seleccione en su proceso.
707
Utilidad de procesamiento de SPSS
Figura 47-13
Visor de objetos
pegarlos en su proceso.
708
Captulo 47
709
Utilidad de procesamiento de SPSS
710
Captulo 47
La descripcin debe poseer formato de comentario, es decir, cada lnea debe comenzar
con un apstrofo.
711
Utilidad de procesamiento de SPSS
Figura 47-16
Creacin de un cuadro de dilogo en el Editor de cuadros de dilogo personalizados
derecho del ratn en el cuadro de dilogo (asegrese de que no hay ningn control
seleccionado en l) y escriba un nombre para la funcin en el campo correspondiente
(Dialog Function). Las instrucciones que definen la funcin se aadirn a su proceso,
aunque tendr que editar manualmente la funcin para definir el funcionamiento de
cada accin.
Cuando termine, pulse en el botn para guardar y salir (situado en el extremo derecho
de la barra de herramientas) y se aadir el cdigo para el cuadro de dilogo a su
proceso.
cuadro de dilogo.
E Elija en los mens:
Proceso
Editor de cuadros de dilogo...
712
Captulo 47
E Seleccione herramientas de la paleta y pulse en el nuevo cuadro de dilogo para
aadir los controles, tales como botones y casillas de verificacin (arrstrelos hasta
la posicin que desee).
E Modifique el tamao del cuadro de dilogo arrastrando los tiradores de los lados y
las esquinas.
E Pulse con el botn derecho en el cuadro (sin ningn control seleccionado) y escriba un
barra de herramientas).
Es necesario editar manualmente la funcin de control del cuadro de dilogo para
definir el funcionamiento del cuadro de dilogo.
Parmetros. La funcin debe ser capaz de cumplir tres parmetros: Una cadena
(strDlgItem) y dos enteros (intAction e intSuppValue). Los parmetros son
valores pasados entre la funcin y el cuadro de dilogo, dependiendo de la accin
que se elija.
713
Utilidad de procesamiento de SPSS
es el nuevo valor.
acciones inactivas.
Si desea obtener ms informacin, consulte los ejemplos y el prototipo DialogFunc
en el archivo de ayuda de referencia sobre el lenguaje Sax BASIC.
714
Captulo 47
Sub Main
Call BuildDialog
End Sub
'define el cuadro de dilogo
Sub BuildDialog
Begin Dialog UserDialog 580,70,"Abrir archivo de datos",.DialogFunc
Text 40,7,280,21,"Archivo de datos para abrir:",.txtDialogTitle
TextBox 40,28,340,21,.txtFilename
OKButton 470,7,100,21,.cmdOK
CancelButton 470,35,100,21,.cmdCancel
End Dialog
Dim dlg As UserDialog
Dialog dlg
End Sub
'define la funcin que determina el comportamiento del cuadro de dilogo
Function DialogFunc(strDlgItem As String, intAction As Integer, intSuppValue As Integer) As Boolean
Select Case intAction
Case 1' emite una seal sonora cuando se inicializa el cuadro de dilogo
Beep
Case 2' cambia el valor o pulsa en el botn
Select Case strDlgItem
Case "cmdOK"'si el usuario pulsa en Aceptar, abre el archivo de datos con el nombre de archivos especificado
strFilename = DlgText("txtFilename")
Call OpenDataFile(strFilename)
DialogFunc = False
715
Utilidad de procesamiento de SPSS
Case "cmdCancel"'Si el usuario pulsa en Cancelar, cierra el cuadro de dilogo
DialogFunc = False
End Select
End Function
Sub OpenDataFile(strFilename As Variant)'Abre el archivo de datos con el nombre de archivo
especificado
Dim objDataDoc As ISpssDataDoc
Set objDataDoc = objSpssApp.OpenDataDoc(strFilename)
End Sub
Depuracin de procesos
EL men Depurar permite recorrer el cdigo paso a paso, ejecutando una lnea o
subrutina por separado y viendo el resultado. Tambin puede insertar un punto de
interrupcin en el proceso para detener la ejecucin en la lnea que contiene dicho
punto de interrupcin.
Para depurar un autoproceso, abra el archivo de autoproceso en una ventana de
proceso, inserte los puntos de interrupcin en el procedimiento que desee depurar y,
seguidamente, ejecute el procedimiento estadstico que desencadena el autoproceso.
Paso hacia dentro. Ejecuta la lnea actual. Si la lnea actual es una subrutina o una
llamada de funcin, se detiene en la primera lnea de esa subrutina o funcin.
Paso por encima. Ejecuta hasta la lnea siguiente. Si la lnea actual es una subrutina o
llamada de funcin, ejecuta la subrutina o funcin por completo.
Paso hacia fuera. Sale de la subrutina o la llamada de funcin actual.
Paso hacia el cursor. Ejecuta hasta la lnea actual.
Alternar salto. Inserta o elimina un punto de interrupcin. El proceso se detiene en el
716
Captulo 47
en la lnea actual.
El proceso se detendr en el punto de interrupcin.
717
Utilidad de procesamiento de SPSS
Figura 47-18
Panel depuracin mostrado en la ventana de proceso
para ver el valor actual de la variable. Tambin puede evaluar una expresin, asignar
una variable o invocar una subrutina.
Escriba subname args y pulse Intro para invocar una subrutina o una instruccin
pre-incorporada.
Escriba Trace y pulse Intro para activar o desactivar el modo de traza. El modo de
traza imprime cada instruccin en la ventana inmediata cuando hay un proceso
en ejecucin.
Pestaa Watch. Para mostrar una variable, una funcin o una expresin, pulse en ella
718
Captulo 47
Pestaa Loaded. Presenta una lista de los procesos activos actualmente. Pulse en
una lnea para ver ese proceso.
719
Utilidad de procesamiento de SPSS
Figura 47-19
Pegado de sintaxis de comandos en un proceso
Al abrir los cuadros de dilogo mediante los mens de la ventana de proceso, el botn
Pegar insertar todo el cdigo necesario para ejecutar el comando desde un proceso.
Nota: Debe utilizar los mens de la ventana de proceso para abrir el cuadro de
dilogo; de otro modo, los comandos se pegarn en una ventana de sintaxis en lugar
de en la ventana de proceso.
720
Captulo 47
E Realice selecciones en el cuadro de dilogo.
E Pulse en Pegar.
Nota: Debe utilizar los mens de la ventana de proceso para abrir el cuadro de
dilogo; de otro modo, los comandos se pegarn en una ventana de sintaxis en lugar
de en la ventana de proceso.
Captulo
48
XML. Las tablas, los resultados de texto e incluso muchos tipos de grficos se
Texto. Las tablas y los resultados de texto se pueden almacenar como texto
721
722
Captulo 48
Figura 48-1
Panel de control del Sistema de gestin de resultados
Puede utilizar el panel de control para iniciar y detener el envo de los resultados
a los distintos destinos.
Cada solicitud de SGR permanece activa hasta que finaliza de forma explcita
o hasta el final de la sesin.
Mientras que una solicitud de SGR est activa, los archivos de destino
especificados se almacenan en la memoria (RAM) y, por consiguiente, las
solicitudes de SGR activas que escriben una gran cantidad de resultados en
archivos externos pueden consumir una cantidad considerable de memoria.
723
Sistema de gestin de resultados
de datos de SPSS, XML o HTML). (Por defecto, se utiliza el formato XML con
los resultados. Si desea obtener ms informacin, consulte Opciones de SGR en
p. 731.)
E Especifique un destino de resultados:
724
Captulo 48
Excluya los resultados seleccionados del Visor. Si selecciona Excluir del Visor,
los tipos de resultados de la solicitud de SGR no se mostrarn en la ventana del
Visor. Si varias solicitudes SGR activas incluyen los mismos tipos de resultados,
la presentacin de dichos tipos de resultados en el Visor se determina mediante
la solicitud de SGR ms reciente que contiene los tipos de resultados. Si desea
obtener ms informacin, consulte Exclusin de presentacin de resultados
del Visor en p. 737.
Los siguientes consejos son tiles para seleccionar varios elementos de una lista:
725
Sistema de gestin de resultados
Para eliminar una solicitud nueva (una solicitud que se ha aadido pero que an
no est activa):
E Pulse en cualquier casilla de la fila para dicha solicitud en la lista Solicitudes.
E Pulse en Eliminar.
Nota: las solicitudes de SGR activas no finalizan hasta que pulsa en Aceptar.
726
Captulo 48
Texto. Objetos de texto que no son logaritmos ni encabezados (incluye los objetos con
clasificacin. Los objetos de rbol slo se incluyen con los formatos de destino XML
y HTML.
Encabezados. Objetos de texto con la etiqueta Ttulo en el panel de titulares del
Visor. Para el formato XML con los resultados, no se incluyen objetos de texto de
encabezado.
Advertencias. Objetos de advertencias. Los objetos de advertencias contienen
727
Sistema de gestin de resultados
Figura 48-2
Tipos de objetos de resultados
728
Captulo 48
Los subtipos de tabla son los diferentes tipos de tablas pivote que se pueden generar.
Algunos subtipos slo estn generados por un comando; otros subtipos se pueden
generar mediante varios comandos (aunque las tablas pueden no presentar un aspecto
similar). Aunque los nombres de subtipos de tabla suelen ser bastante descriptivos,
puede haber muchos entre los que elegir (sobre todo si ha seleccionado un nmero
considerable de comandos); adems, dos subtipos pueden tener nombres muy
similares.
Para buscar identificadores de comandos y subtipos de tabla
En caso de duda, puede buscar los nombres de los identificadores de comandos y los
subtipos de tabla en la ventana del Visor:
E Ejecute el procedimiento para generar algunos resultados en el Visor.
E Pulse con el botn derecho del ratn en el elemento del panel de titulares del Visor.
E Seleccione Copiar identificador de comandos de SGR o Copiar subtipo de tablas de SGR.
729
Sistema de gestin de resultados
E Pegue el nombre del identificador de comandos o del subtipo de tabla copiado en
Etiquetas
En lugar de los nombres de subtipos de tabla, puede seleccionar tablas basadas en el
texto mostrado en el panel de titulares del Visor. Tambin puede seleccionar otros
tipos de objeto basados en las etiquetas. Las etiquetas resultan tiles para diferenciar
varias tablas del mismo tipo en las que el texto del titular refleja algn atributo del
objeto de resultados concreto como las etiquetas o los nombres de las variables. Hay,
no obstante, ciertos factores que pueden afectar al texto de la etiqueta:
Las etiquetas que incluyen informacin sobre las variables o los valores se
ven afectadas por la configuracin actual de las opciones de las etiquetas de
resultados (men Edicin, Opciones, pestaa Etiquetas de los resultados).
Las etiquetas se ven afectadas por el ajuste actual del idioma de los resultados
(men Edicin, Opciones, pestaa General).
Para especificar las etiquetas que se van a utilizar para identificar los objetos de
resultados
E En el panel de control del Sistema de gestin de resultados, seleccione uno o ms
730
Captulo 48
Figura 48-3
Cuadro de dilogo Etiquetas de SGR
del Visor. Tambin puede pulsar con el botn derecho del ratn en el elemento del
titular, elegir Copiar etiqueta de SGR y pegar la etiqueta copiada en el campo de texto
Etiqueta.
E Pulse en Aadir.
E Repita el proceso con cada etiqueta de tabla que desee incluir.
E Pulse en Continuar.
Comodines
Puede utilizar un asterisco (*) como ltimo carcter de la cadena de etiqueta y como
carcter comodn. Se seleccionarn todas las etiquetas que empiecen por la cadena
especificada (excepto el asterisco). Este proceso slo funciona si el asterisco es el
ltimo carcter, ya que los asteriscos pueden aparecer como caracteres vlidos en
una etiqueta.
731
Sistema de gestin de resultados
Opciones de SGR
Puede utilizar el cuadro de dilogo Opciones de SGR para:
En el caso del formato de archivo de datos de SPSS, incluya una variable que
identifique el nmero de tabla secuencial que sea el origen en cada caso.
732
Captulo 48
Formato
XML con los resultados. XML que se adapta al esquema de resultados de SPSS. Los
de un archivo JAR/ZIP que contiene XML, CSV y otros archivos. El servidor Web de
SmartViewer es un producto independiente basado en un servidor.
Texto. Texto separado por espacios. Los resultados se escriben como texto con los
resultados tabulares alineados con espacios para las fuentes de paso fijo. Se excluyen
todos los grficos y mapas.
Texto con tabulaciones. Texto delimitado por tabulaciones. Para los resultados que
se muestran como tablas pivote en el Visor, las tabulaciones delimitan los elementos
de columnas de tabla. Las lneas de bloque de texto se escriben sin cambios; no se
realiza ningn intento de dividirlas con tabulaciones en las posiciones tiles. Se
excluyen todos los grficos y mapas.
733
Sistema de gestin de resultados
Imgenes de grficos
Para el formato HTML, puede incluir grficos (excluyendo los grficos interactivos)
y diagramas de modelo de rbol como archivos de imagen. Se crea un archivo de
imagen independiente para cada grfico o rbol, y se incluyen etiquetas <IMG
SRC='filename'> estndar en HTML para cada archivo de imagen.
Los archivos de imagen se guardan en un subdirectorio (carpeta) independiente.
El nombre del subdirectorio es el nombre del archivo de destino HTML sin ninguna
extensin y con _files aadido al final. Por ejemplo, si el archivo de destino HTML es
julydata.htm, el subdirectorio de imgenes se llamar julydata_files.
Formato. Los formatos de imagen disponibles son PNG, JPG, EMF y BMP.
Tamao. Puede ajustar la escala del tamao de imagen del 10% al 200%.
Pivotes de tabla
Para los resultados de las tablas pivote, puede especificar los elementos de dimensin
que deben aparecer en las columnas. El resto de los elementos de dimensin aparecen
en las filas. Para el formato de archivo de datos de SPSS, las columnas de tabla se
convierten en variables y las filas en casos.
Los pivotes de tabla especificados aqu no surtirn ningn efecto en las tablas
que se muestran en el Visor.
Cada dimensin de una tabla (fila, columna, capa) puede contener cero o ms
elementos. Por ejemplo, una tabla de contingencia sencilla de dos dimensiones
contiene un nico elemento de dimensin de fila y un nico elemento de dimensin
de columna, cada uno de los cuales contiene una de las variables utilizadas en la tabla.
Puede utilizar argumentos de posicin o nombres de elementos de dimensin para
especificar los elementos de dimensin que desea colocar en la dimensin de columna.
734
Captulo 48
Todas las dimensiones en filas. Crea una fila nica para cada tabla. Para los archivos
de datos con formato SPSS, significa que cada tabla es un caso nico y que todos los
elementos de tabla son variables.
Lista de posiciones. El formato general de un argumento de posicin es una letra que
indica la posicin por defecto del elemento (C para columna, R para fila o L para
capa) seguida de un nmero entero positivo que indica la posicin por defecto en la
dimensin. Por ejemplo, R1 indica el elemento de dimensin de fila ms exterior.
CALL RALL LALL (o RALL CALL LALL, etc.) coloca los elementos de
dimensin en las columnas. Para el formato de archivo de datos de SPSS, se
genera de este modo una fila o caso por tabla en el archivo de datos.
Figura 48-5
Argumentos de posicin de filas y columnas
nombres de elementos de dimensin, que son las etiquetas de texto que aparecen
en la tabla. Por ejemplo, una tabla de contingencia sencilla de do s dimensiones
contiene un nico elemento de dimensin de fila y un nico elemento de dimensin de
columna, cada uno de los cuales incluye etiquetas basadas en las variables de dichas
735
Sistema de gestin de resultados
Las etiquetas asociadas con los elementos de dimensin pueden no ser siempre
evidentes.
Para ver todos los elementos de dimensin y sus etiquetas para una tabla pivote
E Active (pulse dos veces en) la tabla en el Visor.
E Elija en los mens:
Ver
Mostrar todo
y/o
E Si los paneles de pivotado no se muestran, elija en los mens:
Pivotar
Paneles de pivotado
E Site el puntero sobre cada icono en los paneles de pivotado para mostrar la etiqueta.
736
Captulo 48
Figura 48-6
Nombres de elementos de dimensin mostrados en la tabla y los paneles de pivotado
Registro
Puede registrar la actividad de SGR en un registro de XML o formato de texto.
737
Sistema de gestin de resultados
en blanco.
E Pulse en Aadir.
Los resultados seleccionados se excluyen del Visor, mientras que el resto de los
resultados se muestran en el Visor del modo normal.
738
Captulo 48
739
Sistema de gestin de resultados
Las primeras tres variables identifican la tabla de origen por comando, subtipo y
etiqueta.
Los dos elementos que definen las filas de la tabla (valores de la variable Sexo
y medidas estadsticas) reciben los nombres de variable genrica Var1 y Var2.
Estas dos variables son variables de cadena.
740
Captulo 48
Figura 48-8
Tabla con capas
741
Sistema de gestin de resultados
Si las etiquetas de columna de las tablas difieren, cada tabla puede aadir
variables al archivo de datos con valores perdidos para los casos de otras tablas
que no tienen una columna con un etiquetado idntico.
Las tablas que contienen las mismas etiquetas de columna suelen generar los archivos
de datos ms tiles de inmediato (archivos de datos que no requieren manipulacin
adicional). Por ejemplo, dos o ms tablas de frecuencia del procedimiento Frecuencias
tienen etiquetas de columna idnticas.
Figura 48-9
Dos tablas con etiquetas de columna idnticas
742
Captulo 48
Aunque los valores para Comando_ y Subtipo_ son los mismos, el valor Etiqueta_
identifica la tabla de origen para cada grupo de casos dado que las dos tablas
de frecuencia tienen distintos ttulos.
Se crea una variable nueva en el archivo de datos para cada etiqueta de columna nica
en las tablas que se envan al archivo de datos. Este proceso ofrece como resultado
bloques de valores perdidos si las tablas contienen distintas etiquetas de columna.
Figura 48-10
Dos tablas con distintas etiquetas de columna
743
Sistema de gestin de resultados
La primera tabla tiene columnas con las etiquetas Salario inicial y Salario actual,
no presentes en la segunda tabla, lo que resulta en una serie de valores perdidos
para dichas variables en los casos de la segunda tabla.
Por el contrario, la segunda tabla tiene columnas con las etiquetas Nivel de
formacin acadmica y Meses desde el contrato, no presentes en la primera
tabla, lo que resulta en una serie de valores perdidos para dichas variables en
los casos de la primera tabla.
Las variables discordantes como las de este ejemplo se pueden generar incluso con
tablas del mismo subtipo. En este ejemplo, ambas tablas son del mismo subtipo.
Si alguna tabla no tiene el mismo nmero de elementos de fila que otras tablas, no
se crear ningn archivo de datos. El nmero de filas no tiene que ser el mismo; el
nmero de elementos de fila que se convierten en variables en el archivo de datos debe
ser el mismo. Por ejemplo, una tabla de contingencia de dos variables y una tabla
de contingencia de tres variables contienen distintos nmeros de elementos de fila
dado que la variable capa est anidada en la variable de fila de la presentacin de
la tabla de contingencia de tres variables por defecto.
Figura 48-11
Tablas con distintos nmeros de elementos de fila
744
Captulo 48
745
Sistema de gestin de resultados
Figura 48-13
Combinacin de distintos tipos de tablas en un archivo de datos mediante el pivotado de
elementos de dimensin
Algunas de las variables incluyen valores perdidos, dado que las estructuras de tabla
an no son exactamente iguales a los estadsticos de las columnas.
A los elementos de fila y capa se les asignan nombres de variable genrica (el
prefijo Var seguido de un nmero secuencial).
746
Captulo 48
Figura 48-14
Nombres de variable generados a partir de elementos de tabla
747
Sistema de gestin de resultados
Los valores de los atributos command y subType de SGR no se ven afectados por
el idioma de los resultados o la configuracin de presentacin para los nombres
de variable y etiquetas o para los valores y etiquetas de valor.
<pivotTable...>
<dimension axis=row...>
<dimension axis=column...>
<category...>
<cell text=... number=... decimals=.../>
</category>
<category...>
<cell text=... number=... decimals=.../>
</category>
</dimension>
748
Captulo 48
</dimension>
...
</pivotTable>
Figura 48-16
XML con los resultados para la tabla de frecuencias simple
749
Sistema de gestin de resultados
<cell text="216" number="216"/>
</category>
<category text="Percent">
<cell text="45.6" number="45.569620253165" decimals="1"/>
</category>
<category text="Valid Percent">
<cell text="45.6" number="45.569620253165" decimals="1"/>
</category>
<category text="Cumulative Percent">
<cell text="45.6" number="45.569620253165" decimals="1"/>
</category>
</dimension>
</category>
<category text="Male" label="Male" string="m" varName="gender">
<dimension axis="column" text="Statistics">
<category text="Frequency">
<cell text="258" number="258"/>
</category>
<category text="Percent">
<cell text="54.4" number="54.430379746835" decimals="1"/>
</category>
<category text="Valid Percent">
<cell text="54.4" number="54.430379746835" decimals="1"/>
</category>
<category text="Cumulative Percent">
<cell text="100.0" number="100" decimals="1"/>
</category>
</dimension>
</category>
</group>
<category text="Total">
<dimension axis="column" text="Statistics">
<category text="Frequency">
<cell text="474" number="474"/>
</category>
<category text="Percent">
<cell text="100.0" number="100" decimals="1"/>
</category>
<category text="Valid Percent">
<cell text="100.0" number="100" decimals="1"/>
</category>
</dimension>
750
Captulo 48
</category>
</group>
</dimension>
</pivotTable>
</command>
</outputTree>
Como puede observar, una tabla sencilla de dimensiones reducidas genera una
cantidad considerable de XML. Esto se debe en parte a que XML contiene
informacin no evidente en la tabla original, informacin que puede no estar
disponible en la tabla original y una cantidad determinada de redundancia.
El contenido de la tabla tal y como aparece (o podra aparecer) en una tabla pivote
en el Visor se incluye en los atributos de texto. A continuacin se muestra un
ejemplo:
Los atributos de texto se pueden ver afectados por el idioma de los resultados y
la configuracin que influyen en la presentacin de los nombres de variable y
etiquetas o valores y etiquetas de valor. En este ejemplo, el valor del atributo de
texto difiere en funcin del idioma de los resultados, mientras que el valor del
atributo de comando permanece igual independientemente del idioma de los
resultados.
Siempre que las variables o los valores se utilicen en las etiquetas de fila o
columna, XML contiene un atributo de texto y uno o ms valores de atributo
adicionales. A continuacin se muestra un ejemplo:
751
Sistema de gestin de resultados
Los elementos <cell> que contienen valores de casilla para los nmeros contienen
el atributo de texto y uno o ms valores de atributo adicionales. A continuacin
se muestra un ejemplo:
El atributo de nmero es el valor numrico real sin redondear, mientras que el atributo
de decimales indica el nmero de decimales que se muestran en la tabla.
Identificadores SGR
El objetivo del cuadro de dilogo Identificadores SGR es ofrecerle asistencia en la
escritura de la sintaxis del comando OMS. Se puede utilizar este cuadro de dilogo
para pegar los identificadores de subtipos y comandos seleccionados en una ventana
de sintaxis de comandos.
752
Captulo 48
Figura 48-17
Cuadro de dilogo Identificadores SGR
753
Sistema de gestin de resultados
panel de titulares.
E Seleccione Copiar identificador de comandos de SGR o Copiar subtipo de tablas de SGR.
Este mtodo presenta una diferencia respecto al del cuadro de dilogo Identificadores
de SGR: el identificador copiado no se pega automticamente en una ventana de
sintaxis de comandos. Slo tiene que copiar el identificador en el Portapapeles y, a
continuacin, podr pegarlo donde desee. Como los valores de los identificadores de
subtipos y comandos son idnticos a los correspondientes valores de los atributos de
subtipos y comandos de los resultados con formato XML (OXML), este mtodo de
copiar y pegar puede resultar muy til para escribir transformaciones XSLT.
Copia de etiquetas SGR
En vez de identificadores, puede copiar etiquetas para utilizarlas con la palabra clave
LABELS. Las etiquetas se pueden utilizar para diferenciar varios grficos o varias
tablas del mismo tipo en las que el texto del titular refleja algn atributo del objeto
de resultados concreto como las etiquetas o los nombres de las variables. Hay, no
obstante, ciertos factores que pueden afectar al texto de la etiqueta:
754
Captulo 48
Las etiquetas se ven afectadas por el ajuste actual del idioma de los resultados
(men Edicin, Opciones, pestaa General).
panel de titulares.
E Seleccione Copiar etiqueta de SGR.
Al igual que ocurra con los identificadores de subtipos y comandos, las etiquetas
deben ir entre comillas y toda la lista debe ir entre corchetes, por ejemplo:
/IF LABELS=['Employment Category' 'Education Level']
Apndice
Cada archivo contiene informacin especfica del nivel sobre un nmero cualquiera
de fuentes de datos. Por ejemplo, su archivo dba03.inf puede contener informacin de
la vista personal para una base de datos de contabilidad corporativa, para la base de
datos de registro de horarios de su empresa y para una base de datos donde registre su
coleccin de CD.
755
756
Apndice A
Apndice
Personalizacin de documentos
HTML
un editor de texto.
E Sustituya los comentarios de los campos en las lneas entre dos corchetes angulares
de apertura (<<), por el texto o el cdigo HTML que desee insertar en sus documentos
HTML exportados.
E Guarde el archivo como un archivo de texto.
757
758
Apndice B
759
Personalizacin de documentos HTML
E En el panel de la izquierda del Editor del registro de configuraciones, seleccione:
HHKEY_CURRENT_USER
Software
SPSS
SPSS para Windows
14.0
Spsswin
E En el panel derecho, pulse dos veces en la cadena HTMLFormatFile.
E En Informacin del valor, escriba la ruta completa y el nombre del archivo de
760
Apndice B
NVI Sales, Inc.
</TITLE>
<META NAME="keywords" CONTENT="gizmos, gadgets, gimcracks">
</HEAD>
<BODY bgcolor="#FFFFFF">
<h2 align=center>NVI Sales</h2>
<h3 align=center>Regional Data</h3>
[Resultado exportado]
<H4 align=center>This page made possible by...
<br><br>
<IMG SRC="spss2.gif" align=center></H4>
</BODY>
</HTML>
ndice
acceso a un servidor, 85
Access (Microsoft), 31
adicin de etiquetas de grupo, 312
agregacin de datos, 225
agregacin de funciones, 228
nombres y etiquetas de variable, 229
agrupacin de categoras, 149
agrupacin de filas o columnas, 312
ajuste, 324
control de la anchura de la columna para el texto
ajustado, 324
etiquetas de variable y de valor, 105
alfa de Cronbach
en Anlisis de fiabilidad, 599, 601
algoritmos, 17
alineacin, 107, 267, 335, 644
en el Editor de datos, 107
en las casillas, 335
resultados, 267, 644
almacenamiento de archivos, 68, 7273, 89
archivos de datos, 7273, 89
archivos de datos de SPSS, 68
consultas del archivo de base de datos, 47
almacenamiento de grficos, 277, 283288, 654,
674
almacenamiento de grficos interactivos con
datos, 654
archivos BMP, 277, 283, 285, 674
archivos EPS, 277, 283, 287, 674
archivos JPEG, 277, 283284, 674
archivos PICT, 277, 283, 285, 674
761
762
ndice
763
ndice
764
ndice
archivo de modelo
carga de modelos guardados para puntuar datos,
209
archivos, 271
adicin de un archivo de texto al Visor, 271
apertura, 25
archivos BMP, 277, 283, 285, 674
exportacin de grficos, 277, 283, 285, 674
archivos de bases de datos, 2931, 3435, 3739,
42, 45, 47
acceso a una base de datos, 34
almacenamiento de consultas, 47
clusula Where, 39
consultas de parmetros, 39, 42
conversin de cadenas en variables numricas,
45
creacin de relaciones, 37
definicin de variables, 45
especificacin de criterios, 39
expresiones condicionales, 39
lectura, 2931, 35
Microsoft Access, 31
muestreo aleatorio, 39
pedir el valor al usuario, 42
propiedades de la relacin, 38
seguridad de la base de datos, 34
seleccin de campos de datos, 35
seleccin de una fuente de datos, 31
sintaxis de SQL, 47
uniones entre tablas, 3738
verificacin de los resultados, 47
archivos de datos, 2526, 49, 6768, 7273, 76,
79, 8890, 238
adicin de comentarios, 636
almacenamiento, 68, 7273
765
ndice
almacenamiento, 7273
apertura, 25
archivos de SAS
almacenamiento, 72
apertura, 25
archivos de Stata, 29
almacenamiento, 72
apertura, 29
lectura, 25
archivos delimitados por tabuladores, 25, 27, 49,
7273, 77
almacenamiento, 7273
apertura, 25
escritura de nombres de variable, 77
lectura de nombres de variables, 27
archivos EPS, 277, 283, 287, 674
exportacin de grficos, 277, 283, 287, 674
archivos JPEG, 277, 283284, 674
exportacin de grficos, 277, 283284, 674
archivos PICT, 277, 283, 285, 674
exportacin de grficos, 277, 283, 285, 674
archivos PNG, 277, 286
exportacin de grficos, 277, 286
archivos porttiles
por defecto, 73
archivos PostScript (encapsulado), 277, 287, 674
exportacin de grficos, 277, 287, 674
archivos SYSTAT, 25
apertura, 25
archivos TIFF, 286
exportacin de grficos, 277, 283, 286, 674
archivos WMF, 277, 283, 288, 674
exportacin de grficos, 277, 283, 288, 674
Asesor estadstico, 15
asignacin de memoria
en Anlisis de conglomerados en dos fases, 519
766
ndice
C de Dunnett
en ANOVA de un factor, 423
en MLG, 439
767
ndice
768
ndice
contrastes de linealidad
en Medias, 396
contrastes polinmicos
en ANOVA de un factor, 422
en MLG, 436
contrastes repetidos
en MLG, 436
contrastes simples
en MLG, 436
control de pgina
en el informe de estadsticos en columnas, 596
en informes de estadsticos en filas, 589
convergencia
en Anlisis de conglomerados de K-medias, 539
en Anlisis factorial, 507, 509
copia, 267, 273
grficos, 273
resultados, 267
tablas pivote, 273
correccin por continuidad de Yates
en Tablas de contingencia, 380
Correlacin de Pearson
en Correlaciones bivariadas, 447
en Tablas de contingencia, 380
correlaciones
de orden cero, 454
en Correlaciones bivariadas, 447
en Correlaciones parciales, 451
en Tablas de contingencia, 380
Correlaciones bivariadas
coeficientes de correlacin, 447
estadsticos, 449
funciones adicionales del comando, 450
nivel de significacin, 447
opciones, 449
valores perdidos, 449
769
ndice
en Medias, 396
en Resumir, 390
Curva COR, 631
estadsticos y grficos, 634
d
en Tablas de contingencia, 380
d de Somers
en Tablas de contingencia, 380
Data List, 77
frente al comando Get Data, 77
datos categricos, 129
conversin de datos de intervalo en categoras
discretas, 149
datos con formato CSV, 49
Datos de Dimensions, 62
datos de serie temporal
creacin de nuevas variables de serie temporal,
203
definicin de variables de datos, 201
funciones de transformacin, 204
sustitucin de valores perdidos, 206
transformaciones de los datos, 200
datos delimitados por comas, 49
datos delimitados por espacios, 49
datos ponderados, 260
y de datos reestructurados, 260
declaraciones de variables, 701702
convenciones de denominacin, 702
en procesos, 701702
definicin de variables, 98, 101, 103105,
107108, 124
aplicacin de un diccionario de datos, 135
copia y pegado de atributos, 107108
etiquetas de valor, 104, 124
etiquetas de variable, 103
770
ndice
plantillas, 107108
tipos de datos, 101
valores perdidos, 105
definir conjuntos de respuestas mltiples, 574
categoras, 574
dicotomas, 574
etiquetas del conjunto, 574
nombres del conjunto, 574
dendrogramas
en Anlisis de conglomerados jerrquico, 531
depuracin de procesos, 715716
avance por los procesos, 715
panel de depuracin, 716
puntos de interrupcin, 715
descomposicin jerrquica, 434
Descriptivos, 361
almacenamiento de puntuaciones z, 361
estadsticos, 363
funciones adicionales del comando, 364
orden de presentacin, 363
desplazamiento de filas y columnas, 311
desviacin absoluta promedio (DAP)
en Estadsticos de la razn, 615
desviacin tpica
en Cubos OLAP, 402
en Descriptivos, 363
en el Informe de estadsticos en columnas, 594
en el Informe de estadsticos en filas, 587
en Estadsticos de la razn, 615
en Explorar, 371
en Frecuencias, 355
en Medias, 396
en MLG Univariante, 444
en Resumir, 390
DfAjuste
en Regresin lineal, 471
DfBeta
en Regresin lineal, 471
diagnsticos de colinealidad
en Regresin lineal, 474
diagnsticos por caso
en Regresin lineal, 474
diagramas de caja
comparacin de niveles del factor, 372
comparacin de variables, 372
en Explorar, 372
diagramas de dispersin
en Regresin lineal, 469
diagramas de dispersin por nivel
en Explorar, 372
en MLG Univariante, 444
diagramas de tmpanos
en Anlisis de conglomerados jerrquico, 531
diario de la sesin, 642
diccionario, 6768
diccionario de datos
aplicar desde otro archivo, 135
diferencia honestamente significativa de Tukey
en ANOVA de un factor, 423
en MLG, 439
diferencia menos significativa
en ANOVA de un factor, 423
en MLG, 439
diferencial relativo al precio (DRP)
en Estadsticos de la razn, 615
diferencias entre grupos
en Cubos OLAP, 405
diferencias entre variables
en Cubos OLAP, 405
directorio temporal, 642
definir ubicacin en modo local, 642
variable de entorno SPSSTMPDIR, 642
771
ndice
distancia chi-cuadrado
en Distancias, 459
distancia de bloques
en Distancias, 459
distancia de Chebychev
en Distancias, 459
Distancia de Cook
en MLG, 442
en Regresin lineal, 471
Distancia de Mahalanobis
en Anlisis discriminante, 493
en Regresin lineal, 471
distancia de Minkowski
en Distancias, 459
Distancia eucldea
en Distancias, 459
distancia eucldea al cuadrado
en Distancias, 459
Distancias, 457
clculo de distancias entre casos, 457
clculo de distancias entre variables, 457
ejemplo, 457
estadsticos, 457
funciones adicionales del comando, 461
medidas de disimilaridad, 459
medidas de similaridad, 460
transformacin de medidas, 459460
transformacin de valores, 459460
divisin
divisin entre columnas del informe, 595
divisor de paneles
Editor de datos, 116
divisor de ventanas
Editor de datos, 116
DMS de Fisher
en MLG, 439
772
ndice
estadstico de Brown-Forsythe
en ANOVA de un factor, 426
estadstico de Cochran
en Tablas de contingencia, 380
estadstico de Mantel-Haenszel
en Tablas de contingencia, 380
estadstico de Welch
en ANOVA de un factor, 426
estadstico Durbin-Watson
en Regresin lineal, 474
estadstico R
en Medias, 396
en Regresin lineal, 474
Estadsticos de la razn, 613
estadsticos, 615
estadsticos descriptivos
en Anlisis de conglomerados en dos fases, 523
en Descriptivos, 361
en Estadsticos de la razn, 615
en Explorar, 371
en Frecuencias, 355
en MLG Univariante, 444
en Resumir, 390
Estimacin curvilnea, 479
almacenamiento de intervalos de pronstico, 484
almacenamiento de residuos, 484
almacenamiento de valores pronosticados, 484
anlisis de la varianza, 479
inclusin de constante, 479
modelos, 483
prediccin, 484
estimaciones de Blom, 177
estimaciones de los parmetros
en MLG Univariante, 444
estimaciones de potencia
en MLG Univariante, 444
773
ndice
estimaciones de proporcin
en la asignacin de rangos a los casos, 177
estimaciones de Rankit, 177
estimaciones de tamao de efecto
en MLG Univariante, 444
estimaciones de Tukey, 177
estimaciones de Van der Waerden, 177
estimador biponderado de Tukey
en Explorar, 371
estimador en onda de Andrews
en Explorar, 371
estimador-M de Huber
en Explorar, 371
Estimador-M redescendente de Hampel
en Explorar, 371
Estimadores robustos centrales
en Explorar, 371
estudio de control de casos
Prueba T para muestras relacionadas, 411
estudio de pares relacionados
en Prueba T para muestras relacionadas, 411
eta
en Medias, 396
en Tablas de contingencia, 380
eta-cuadrado
en Medias, 396
en MLG Univariante, 444
etiquetas, 312
eliminacin, 312
frente a nombres de subtipos en SGR, 729
insercin de etiquetas de grupo, 312
etiquetas de grupo, 312
etiquetas de valor, 104, 111, 116, 124, 647
aplicacin a varias variables, 130
copia, 130
en archivos de datos fusionados, 222
774
ndice
F mltiple de Ryan-Einot-Gabriel-Welsch
en ANOVA de un factor, 423
en MLG, 439
factor de inflacin de la varianza
en Regresin lineal, 474
factorizacin de ejes principales, 507
fiabilidad de dos mitades
en Anlisis de fiabilidad, 599, 601
fiabilidad de Spearman-Brown
en Anlisis de fiabilidad, 601
filas, 338
seleccin en tablas pivote, 338
formato, 301
columnas en informes, 586
resultados de borrador, 301
formato con comas, 101, 103
Formato de archivo de datos de SPSS
envo de resultados a un archivo de datos, 731,
737
formato de archivo SAV
envo de resultados a un archivo de datos de
SPSS, 731, 737
formato de cadena, 101
formato de columnas, 334
cambio en las tablas pivote, 334
formato de dlar, 101, 103
formato de puntos, 101, 103
formato Excel
exportacin de resultados, 277, 280
formato fijo, 49
formato libre, 49
formato numrico, 101, 103
Formato PowerPoint
exportacin de resultados, 277
formato Word
exportacin de resultados, 277, 280
775
ndice
H de Kruskal-Wallis
en Pruebas para dos muestras independientes,
565
histogramas
en Explorar, 372
en Frecuencias, 358
en Regresin lineal, 469
HTML, 277, 280, 674, 757
adicin de cdigo personalizado, 757
exportacin de resultados, 277, 280, 674
iconos, 668
de los cuadros de dilogo, 13
776
ndice
777
ndice
778
ndice
en Explorar, 371
en Frecuencias, 355
en Medias, 396
en Resumir, 390
subgrupo, 393, 399
media armnica
en Cubos OLAP, 402
en Medias, 396
en Resumir, 390
media geomtrica
en Cubos OLAP, 402
en Medias, 396
en Resumir, 390
media ponderada
en Estadsticos de la razn, 615
media recortada
en Explorar, 371
mediana
en Cubos OLAP, 402
en Estadsticos de la razn, 615
en Explorar, 371
en Frecuencias, 355
en Medias, 396
en Resumir, 390
mediana agrupada
en Cubos OLAP, 402
en Medias, 396
en Resumir, 390
Medias, 393, 688
estadsticos, 396
opciones, 396
resultados en ASCII, 688
medias de grupo, 393, 399
medias de subgrupo, 393, 399
medias marginales estimadas
en MLG Univariante, 444
medias observadas
en MLG Univariante, 444
medida de diferencia de configuracin
en Distancias, 459
medida de diferencia de tamao
en Distancias, 459
medida de disimilaridad de Lance y Williams, 459
en Distancias, 459
medida de distancia de phi cuadrado
en Distancias, 459
medidas de dispersin
en Descriptivos, 363
en Estadsticos de la razn, 615
en Explorar, 371
en Frecuencias, 355
medidas de distancia
en Anlisis de conglomerados jerrquico, 529
en Distancias, 459
medidas de distribucin
en Descriptivos, 363
en Frecuencias, 355
medidas de similaridad
en Anlisis de conglomerados jerrquico, 529
en Distancias, 460
medidas de tendencia central
en Estadsticos de la razn, 615
en Explorar, 371
en Frecuencias, 355
memoria, 642
mens, 9, 663
personalizacin, 663
metarchivos, 277, 283, 674
exportacin de grficos, 277, 283, 674
mtodos, 705
objetos de automatizacin OLE, 705
779
ndice
modelo cuadrtico
en Estimacin curvilnea, 483
modelo cbico
en Estimacin curvilnea, 483
modelo de crecimiento
en Estimacin curvilnea, 483
modelo de curva S
en Estimacin curvilnea, 483
modelo de Guttman
en Anlisis de fiabilidad, 599, 601
modelo de potencia
en Estimacin curvilnea, 483
modelo estrictamente paralelo
en Anlisis de fiabilidad, 599, 601
modelo exponencial
en Estimacin curvilnea, 483
modelo inverso
en Estimacin curvilnea, 483
modelo lineal
en Estimacin curvilnea, 483
modelo logartmico
en Estimacin curvilnea, 483
modelo logstico
en Estimacin curvilnea, 483
modelo paralelo
en Anlisis de fiabilidad, 599, 601
modelos factoriales completos
en MLG, 433
modelos personalizados
en MLG, 433
modificadores de la lnea de comando, 683
Unidad de produccin, 683
modo distribuido, 83, 85, 8890, 92, 679
acceso a un archivo de datos, 88, 90
almacenamiento de archivos de datos, 89
procedimientos disponibles, 92
780
ndice
en Resumir, 390
nmero mximo de ramas
en Anlisis de conglomerados en dos fases, 519
nmeros de puerto, 85
objetos, 700, 702703, 706
conceptos bsicos, 700, 702
convenciones de denominacin de variables, 702
uso en procesos, 700, 703, 706
objetos ActiveX, 273
objetos de automatizacin, 700, 702703, 705706
convenciones de denominacin de variables, 702
mtodos, 705
propiedades, 705
tipos, 702
uso en procesos, 700, 703, 706
visor de objetos, 706
ocultacin, 265266, 319320, 664
barras de herramientas, 664
etiquetas de dimensin, 320
filas y columnas, 319
notas al pie, 320
resultados de un procedimiento, 266
textos al pie, 320
ttulos, 320
ocultacin (exclusin) de resultados del Visor con
SGR, 737
opciones, 642, 644645, 647, 649, 654655,
658659, 661
aos de dos dgitos, 658
aspecto de tablas pivote, 655
datos, 658
directorio temporal, 642
etiquetas de los resultados, 647
generales, 642
grficos, 649
781
ndice
782
ndice
783
ndice
prueba de Shapiro-Wilk
en Explorar, 372
prueba de Wilcoxon de los rangos con signo
en Pruebas para dos muestras relacionadas, 561
prueba exacta de Fisher
en Tablas de contingencia, 380
Prueba M de Box
en Anlisis discriminante, 491
prueba t
en MLG Univariante, 444
en Prueba T para muestras relacionadas, 411
en Prueba t para una muestra, 414
en Pruebas t para muestras independientes, 407
prueba t de Dunnett
en ANOVA de un factor, 423
en MLG, 439
prueba t de Sidak
en ANOVA de un factor, 423
en MLG, 439
prueba t de Student, 407
prueba t de Waller-Duncan
en ANOVA de un factor, 423
en MLG, 439
prueba t dependiente
en Prueba T para muestras relacionadas, 411
prueba t para dos muestras
en Pruebas t para muestras independientes, 407
Prueba T para muestras independientes, 407
definicin de grupos, 410
intervalos de confianza, 411
opciones, 411
valores perdidos, 411
variables de agrupacin, 410
variables de cadena, 410
Prueba T para muestras relacionadas, 411
opciones, 414
784
ndice
785
ndice
Quanvert, 62
R mltiple
en Regresin lineal, 474
R-E-G-W F
en ANOVA de un factor, 423
en MLG, 439
R-E-G-W Q
en ANOVA de un factor, 423
en MLG, 439
R2
Cambio en R2, 474
en Medias, 396
en Regresin lineal, 474
R2 ajustado
en Regresin lineal, 474
Rachas de Wald-Wolfowitz
en Pruebas para dos muestras independientes,
559
rango
en Cubos OLAP, 402
en Descriptivos, 363
en Estadsticos de la razn, 615
en Frecuencias, 355
en Medias, 396
en Resumir, 390
rango mltiple de Ryan-Einot-Gabriel-Welsch
en ANOVA de un factor, 423
en MLG, 439
razn entre covarianzas
en Regresin lineal, 471
recodificacin de los valores, 149, 169170,
172173, 180
recuento de apariciones, 167
recuento esperado
en Tablas de contingencia, 384
recuento observado
en Tablas de contingencia, 384
reduccin de grficos exportados, 283
reestructuracin de los datos, 238, 241244, 247,
249250, 252253, 255256, 258, 260
conceptos bsicos, 238
creacin de una nica variable de ndice para
variables a casos, 250
creacin de variables de ndice para variables a
casos, 247
creacin de varias variables de ndice para
variables a casos, 252
ejemplo de casos a variables, 242
ejemplo de dos ndices para variables a casos,
249
ejemplo de un ndice para variables a casos, 249
ejemplo de variables a casos, 241
grupos de variables para variables a casos, 243
opciones para casos a variables, 258
opciones para variables a casos, 253
ordenacin de los datos para reestructurar casos
a variables, 256
seleccin de datos para reestructurar casos a
variables, 255
seleccin de datos para reestructurar variables
a casos, 244
tipos de reestructuracin, 238
y datos ponderados, 260
regresin
grficos, 469
Regresin lineal, 463
regresin mltiple, 463
Regresin lineal, 463
almacenamiento de nuevas variables, 471
bloques, 463
estadsticos, 474
786
ndice
copia, 266267
copia en otras aplicaciones, 273
copia y pegado de mltiples elementos, 275
desplazamiento, 266
eliminacin, 266
exportacin, 277, 674
modificacin, 339
ocultacin, 265
pegado en otras aplicaciones, 272
presentacin, 265
Visor, 263
Resmenes de casos, 387
Resumir
estadsticos, 390
opciones, 389
rho
en Correlaciones bivariadas, 447
en Tablas de contingencia, 380
riesgo
en Tablas de contingencia, 380
riesgo relativo
en Tablas de contingencia, 380
rotacin de etiquetas, 313
rotacin equamax
en Anlisis factorial, 509
rotacin oblimin directa
en Anlisis factorial, 509
rotacin quartimax
en Anlisis factorial, 509
rotacin varimax
en Anlisis factorial, 509
rupturas de tabla, 341
S-stress
en Escalamiento multidimensional, 605
787
ndice
saltos de lnea
etiquetas de variable y de valor, 105
seleccin de casos, 231
muestra aleatoria, 234
rango de casos, 235
rango de fechas, 235
rango de horas, 235
segn criterios de seleccin, 233
seleccin hacia delante
en Regresin lineal, 467
seleccin por pasos
en Regresin lineal, 467
semilla de aleatorizacin, 165
sealizacin de vistas de tablas pivote, 317
sealizadores, 317
separacin de tablas, 341
control de las rupturas de tabla, 341
servidores, 85
acceso, 85
adicin, 85
edicin, 85
nombres, 85
nmeros de puerto, 85
servidores remotos, 83, 85, 8890, 92, 679
acceso, 85
acceso a un archivo de datos, 88, 90
adicin, 85
almacenamiento de archivos de datos, 89
edicin, 85
procedimientos disponibles, 92
rutas de acceso UNC, 92
Unidad de produccin, 679
SGR, 721, 751
control de pivotes de tabla, 731, 744
exclusin de resultados del Visor, 737
Formato de archivo de datos de SPSS, 731, 737
788
ndice
log, 644645
pegado, 346
reglas de la Unidad de produccin, 671
reglas de sintaxis, 344
Sistema de gestin de resultados (SGR), 721, 751
sistema de medida, 642
sombreado, 337
en las casillas, 337
SPSS
pasos bsicos, 14
stress
en Escalamiento multidimensional, 605
Student-Newman-Keuls
en ANOVA de un factor, 423
en MLG, 439
suavizado T4253H, 204
subconjuntos de casos
muestra aleatoria, 234
seleccin, 231, 233, 235
subtipos, 728
frente a etiquetas, 729
subtipos de tabla, 728
frente a etiquetas, 729
subttulos
en los grficos, 625
subtotales
en el informe de estadsticos en columnas, 596
suma
en Cubos OLAP, 402
en Descriptivos, 363
en Frecuencias, 355
en Medias, 396
en Resumir, 390
suma de cuadrados, 434
en MLG, 433
789
ndice
tablas de frecuencias
en Explorar, 371
en Frecuencias, 353
tablas pivote, 265, 272275, 277, 289, 309314,
319, 321, 323326, 328, 330, 332, 338339,
341, 655, 674, 680
adicin de texto al pie, 339
agrupacin de filas o columnas, 312
ajustes en la anchura de columna por defecto,
655
anchuras de casillas, 332
aspecto por defecto para las tablas nuevas, 655
bordes, 328
bsqueda de definiciones de etiqueta, 314
cambio del aspecto, 321
cambio del orden de presentacin, 311
capas, 314
control de las rupturas de tabla, 341
control del formato en los trabajos de produccin,
680
copia, 273
copia en otras aplicaciones, 273
copia y pegado de mltiples tablas, 275
desagrupacin de filas o columnas, 312
desplazamiento de filas y columnas, 311
edicin, 309
edicin de dos o ms, 309
eliminacin de etiquetas de grupo, 312
escalamiento para ajustarse a la pgina, 324, 330
exportacin como HTML, 277, 674
formatos de casilla, 326
gestin, 309
identificacin de dimensiones, 310
impresin de capas, 289
impresin de tablas grandes, 341
incrustacin como objetos ActiveX, 273
790
ndice
tolerancia
en Regresin lineal, 474
totales, 688
aplicacin automtica de la negrita en los
resultados, 688
totales finales
en el informe de estadsticos en columnas, 597
transformaciones condicionales, 163
transformaciones de archivos, 238
agregacin de datos, 225
fusin de archivos de datos, 218, 222
ordenacin de casos, 216
ponderacin de casos, 236
procesamiento de segmentacin del archivo, 230
reestructuracin de los datos, 238
transposicin de variables y casos, 217
transformaciones de los datos, 658
asignacin de rangos a los casos, 176
clculo de variables, 161
funciones, 164
recodificacin de los valores, 169170,
172173, 180
retraso de la ejecucin, 658
transformaciones condicionales, 163
variables de cadena, 164
variables de series temporales, 200, 203
transposicin de filas y columnas, 311
transposicin de variables y casos, 217
tratamiento del ruido
en Anlisis de conglomerados en dos fases, 519
U de Mann-Whitney
en Pruebas para dos muestras independientes,
559
ltima
en Cubos OLAP, 402
791
ndice
en Medias, 396
en Resumir, 390
umbral inicial
en Anlisis de conglomerados en dos fases, 519
Unidad de produccin, 642, 644645, 671, 674,
676, 678680, 683, 685
archivos de resultados, 671
control del formato en las tablas pivote, 680
control del formato mediante sintaxis de
comandos, 682
ejecucin de varios trabajos de produccin, 683
entrada de macro, 678
especificacin de un servidor remoto, 679
exportacin de grficos, 671, 674
exportacin de resultados, 674
modificadores de la lnea de comando, 683
opciones, 679
programacin de trabajos de produccin, 683
publicacin de resultados, 685
publicacin en Web, 685
reglas de sintaxis, 671
sustitucin de valores en archivos de sintaxis,
676
uso de la sintaxis de comandos de archivos de
diario, 642
uso de la sintaxis de comandos de la anotacin,
644645
unidades compartidas, 92
V
en Tablas de contingencia, 380
V de Cramr
en Tablas de contingencia, 380
V de Rao
en Anlisis discriminante, 493
valores, 334
formato de presentacin de las tablas pivote, 334
valores atpicos
en Anlisis de conglomerados en dos fases, 519
en Explorar, 371
en Regresin lineal, 469
valores de datos de categorizacin, 149
valores de influencia
en MLG, 442
en Regresin lineal, 471
valores definidos por el usuario como perdidos, 105
valores extremos
en Explorar, 371
valores perdidos, 105
definicin, 105
en Anlisis factorial, 511
en ANOVA de un factor, 426
en Correlaciones bivariadas, 449
en Correlaciones parciales, 454
en Curva COR..., 634
en el informe de estadsticos en columnas, 597
en el Informe de estadsticos en filas, 589
en Explorar, 374
en la prueba de chi-cuadrado, 547
en las frecuencias de respuestas mltiples, 576
en las funciones, 165
en las tablas de contingencia de respuestas
mltiples, 581
en los grficos, 626
en Prueba binomial, 550
en Prueba de Kolmogorov-Smirnov para una
muestra, 556
en Prueba de rachas, 553
en Prueba T para muestras relacionadas, 414
en Prueba t para una muestra, 416
792
ndice
793
ndice
en Frecuencias, 355
en Medias, 396
en Resumir, 390
varias vistas/paneles
Editor de datos, 116
varios archivos de datos abiertos, 119
velocidad, 79
cach de datos, 79
ventana activa, 8
ventana de proceso, 692, 694, 706
men Depurar, 715
pestaa Immediate, 716
pestaa Loaded, 716
pestaa Stack, 716
pestaa Watch, 716
propiedades, 694
visor de objetos, 706
ventana designada, 8
ventanas, 7
ventana activa, 8
ventana designada, 8
ventanas de ayuda, 17
Visor, 263, 265271, 276, 295296, 644, 647
almacenamiento de documentos, 296
cambio de las fuentes de los titulares, 271
cambio de los niveles de titulares, 270
cambio de los tamaos de los titulares, 270
contraccin de titulares, 269
copia de resultados, 267
desplazamiento de los resultados, 266
eliminacin de resultados, 266
espacio entre los elementos de resultados, 295
exclusin de tipos de resultados con SGR, 737
expansin de titulares, 269
muestra de los valores de datos, 647
ocultacin de resultados, 265
W de Kendall
en pruebas para varias muestras relacionadas,
571
Web, 686
publicacin de resultados en, 686
XML
almacenamiento de resultados como XML, 721
envo de resultados a XML, 731
794
ndice