Está en la página 1de 104

SPSS BSICO

ESTRUCTURA DEL SPSS


El programa SPSS (Statistical Product and service Solutions ) es un conjunto de potentes
herramientas de tratamiento de datos y anlisis estadstico. Al igual que muchas aplicaciones
que utilizan como soporte el sistema operativo Windows, el SPSS funciona mediante mens
desplegables y cuadros de dilogo que permiten realizar la mayor parte del trabajo
simplemente utilizando el puntero del ratn.
Tipos de ventanas SPSS
Existen ocho tipos de ventanas SPSS, aunque no todas ellas poseen la misma importancia
desde el punto de vista de su utilidad para el usuario. Las dos ventanas principales son:

El Editor de datos, de aspecto y funcionalidad anlogos a las de cualquier hoja de


clculo. Se abre automticamente cuando se abre el programa SPSS y puede mostrar
dos contenidos diferentes: los datos propiamente dichos (ver Figura 1) y las variables
del archivo acompaadas del conjunto de caractersticas que la definen (ver Figura 2).

Figura 1. Ventana del editor de datos: Vista de datos

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 2. Ventana del editor de datos: vista de variables

El visor de Resultados. Recoge toda la informacin (estadsticos, tablas, grficos,


etc.) que el SPSS genera como consecuencia de las acciones que lleva a cabo.

Figura 3. Visor de Resultados

Prof. Willer David Chanduv Puicn

SPSS BSICO
Barras de Mens
Las barras de mens contienen una serie de mens desplegables que permiten controlar la
mayora de las acciones que el SPSS puede llevar a cabo. Se encuentran situadas en la parte
superior de cada ventana, justo debajo del nombre de la ventana. Cada tipo de ventana SPSS
tiene su propia barra de mens, con opciones particulares para las funciones relacionadas con
esa ventana. Algunos de estos mens, como Estadsticos, Grficos o Ventana, se repiten en
todas las ventanas. Otros mens son especficos de un tipo particular de ventana. A
continuacin se describen todos ellos, con indicacin de a qu tipo de ventana pertenecen y
en qu tipo de ventana no estn disponibles.
Mens
Archivo. Desde este men pueden crearse archivos de datos y de sintaxis; abrir y guardar
todo tipo de archivos, importar / exportar archivos desde/a otros programas (hojas de clculo,
bases de datos, procesadores de texto, etc.); imprimir archivos o partes de u archivo, obtener
una vista previa del resultado de la impresin; recuperar archivos utilizados recientemente,
etc.
Edicin. Permite editar (cortar, copiar, pegar, buscar, seleccionar, reemplazar, etc.) el
contenido de un archivo; deshacer y rehacer acciones de edicin; y modificar algunas de las
especificaciones iniciales (denominadas opciones) con las que arranca el programa.
Ver. Controla el aspecto de las distintas ventanas SPSS mediante una serie de opciones que
permiten mostrar/ocultar la barra de estado, personalizar la barra de herramientas, seleccionar
el tipo y tamao de las fuentes utilizadas; etc. En el Editor de datos, adems, se puede
controlar el aspecto de las celdas (con lneas o sin lneas) y mostrar/ocultar las etiquetas de
los valores. En el visor de resultados, sirve para mostrar/ocultar resultados concretos y para
contraer/expandir bloques de resultados.

Prof. Willer David Chanduv Puicn

SPSS BSICO

Datos. Slo disponible en el Editor de datos. Contiene funciones propias del editor de datos,:
fusionar archivo de datos, trasponer las filas y las columnas, seleccionar slo una parte del
archivo, dividir el archivo en subgrupos, insertar filas o columnas nuevas, etc.
Transformar. Slo disponible en el Editor de Datos. Este men permite crear variables
nuevas y cambiar los valores de las variables ya existentes poniendo a disposicin del usuario
una gran cantidad de funciones.
Insertar. Disponible en el Visor de resultados, en el editor de tablas y en el editor de texto.
Contiene opciones para insertar texto, grficos, ttulos, encabezamientos, notas, salto de
pgina, objeto de otras aplicaciones, etc.
Pivotar. Slo disponible en el editor de tablas. Ofrece mltiples posibilidades de edicin y
de modificacin de la ubicacin de las entradas (filas, columnas, capas) de las tablas
pivotantes del Visor de resultados.
Galera. Slo disponible en el editor de grficos. Permite seleccionar diferentes tipos de
grficos para unos mismos datos.
Diseo. Slo disponible en el Editor de grficos. Contiene mltiples opciones para controlar
las caractersticas de u grfico: la escala y los resultados de los ejes, los ttulos y las
leyendas, los tipos de letra, los colores, etc.
Formato. Disponible en el visor de resultados y en sus tres editores (texto, grficos y tablas).
En el visor de resultados, permite cambiar el alineamiento de los objetos de resultados. En el
editor de tablas contiene opciones para controlar el formato y las propiedades de las tablas de
resultados y de sus casillas. En el editor de grficos, permite controlar el color y la trama de
relleno, el estilo de las lneas y de las barras, y el tipo de letra; tambin permite controlar el
tipo de interpolacin, intercambiar los ejes de un grfico, efectuar rotaciones 3D en los
diagramas de dispersin, desgajar uno o ms sectores de un diagrama de sectores y modificar
el tratamiento dado a los valores perdidos. En el editor de texto, sirve para modificar el tipo
de letra y el alineamiento de los objetos de texto.

Prof. Willer David Chanduv Puicn

SPSS BSICO

Analizar. Contiene todos los procedimientos estadsticos. El contenido de este men depende
de la cantidad de mdulos SPSS que se tengan instalados.
Grficos. Desde este men es posible generar todo tipo de grficos; de barras, de lneas, de
sectores, diagramas de dispersin, histogramas, grficos de control de calidad, etc.
Utilidades. No disponible en el editor de grficos. Permite obtener informacin sobre las
variables o sobre el archivo de datos, controlar las variables que aparecen en las listas de
variables de los cuadros de dilogo, ejecutar procesos (o crear y editar autoprocesos desde el
visor de resultados) y editar las barras de mens. En el visor de resultados y en el editor de
sintaxis, este men ofrece la posibilidad de cambiar de ventana designada.
Ventana. No disponible en el editor de grficos. Permite cambiar de una ventana a otra
dentro del SPSS y minimiza todas las ventanas abiertas.
Ayuda. Ofrece ayuda general sobre las funciones ms importantes del SPSS y proporciona
acceso a la pgina principal de SPSS en Internet.
Barras de herramientas
Una barra de herramientas es un conjunto de botones iconos que permite ejecutar alguna
de las funciones del SPSS de forma rpida y sencilla (por supuesto, funciones que tambin
son posibles de ejecutar con las opciones de las barras de mens).
A continuacin se describen, como ejemplo de la barra de herramientas, la barra del editor de
datos. El resto de la barra de herramientas son similares a sta.

Prof. Willer David Chanduv Puicn

SPSS BSICO

Abrir archivo. Muestra el cuadro de dilogo abrir archivo, el cual permite abrir un
archivo SPSS de cualquier tipo.
Guardar Archivo. Guarda el archivo de datos. Si el archivo no tiene nombre, abre el
cuadro de dilogo Guardar archivo, el cual permite asignar nombre y ruta del archivo
de la ventana activa.
Imprimir. Abre el cuadro de dilogo imprimir documento, el cual permite imprimir
el archivo completo o slo una parte seleccionada.
Recuperar cuadros de dilogo. Muestra una lista con los ltimos cuadros de dilogo
abiertos.
Deshacer/rehacer. Deshace o rehace las ltimas acciones de edicin llevadas a cabo.

Ir a caso. Abre el cuadro de dilogo ir a caso, el cual permite desplazar el cursor a


un caso concreto de un archivo de datos.
Variables. Abre el cuadro de dilogo Variables, que contiene informacin sobre el
formato, las etiquetas y los valores perdidos de las variables del archivo de datos.

Buscar. Abre el cuadro de dilogo Buscar datos, el cual permite buscar valores
concretos en la variable en la que se encuentra el cursor.
Insertar caso. Inserta una fila nueva (inmediatamente ms arriba) de la fila en la que
se encuentra situado el cursor.

Prof. Willer David Chanduv Puicn

SPSS BSICO
Insertar variable. Inserta una columna nueva delante (inmediatamente a la
izquierda) de la columna en la que se encuentra situado el cursor.
Segmentar archivo. Abre el conjunto de dilogo Segmentar archivo, el cual permite
dividir el archivo de datos en grupos (segmentos) utilizando una o ms variables.
Ponderar casos. Abre el cuadro de dilogo Ponderar casos, el cual permite utilizar
una variable para ponderar los casos del archivo de datos.
Seleccionar casos. Abre el cuadro de dilogo Seleccionar casos,, el cual permite
seleccionar una parte del archivo de datos utilizando diferentes criterios.
Mostrar etiquetas de valor. Hace que las celdas del Editor de datos, muestren las
etiquetas de los valores. Al presionarlo de nuevo, las celdas muestran los valores.

ARCHIVO DE DATOS
Las opciones del men Archivo permiten abrir, guardar, imprimir, exportar, etc., el
contenido de las diferentes ventanas SPSS. Este men tambin incluyen la opcin Salir.
Archivos Nuevos.
La opcin Nuevo del men Archivo crea un archivo (ventana) nuevo. Para que esta opcin
tenga efecto es necesario seleccionar el tipo de ventana que se desea crear:

Datos. Vaca el contenido del Editor de datos y lo deja preparado para introducir
nuevos datos o para abrir un archivo de datos existentes.

Sintaxis. Abre una ventana del Editor de sintaxis. En este tipo de ventanas o archivos
es donde se pegan, si as se solicita con el botn Pegar de los cuadros de dilogo, las
instrucciones en que se basan las acciones que el SPSS lleva a cabo.

Resultados. Abre el Visor de resultados. Las ventanas o archivos de resultados


recogen toda la informacin que el SPSS genera: estadsticos, tablas, grficos, etc.

Resultados de borrador. Abre el Visor de resultados en formato borrador.

Prof. Willer David Chanduv Puicn

SPSS BSICO

Proceso. Abre el Editor de proceso del SPSS, el cual permite crear archivos capaces
de personalizar algunos aspectos del funcionamiento del programa.

Figura 4. Men archivo nuevo.

Abrir archivo de datos.


Los archivos de datos pueden tener formatos muy diversos, y este programa se ha sido
diseado para trabajar con muchos de ellos, incluyendo:

Hojas de clculo creadas con Lotus 1-2-3 y Excel.

Archivos de bases de datos creados con dBase y varios formatos SQL.

Archivos de texto delimitados por tabuladores y otros tipos de archivos de texto


ASCII.

Archivos de datos con formato SPSS creados en otros sistemas operativos.

Archivos de datos de SYSTAT.

Archivos de datos de SAS

Para abrir un archivo seleccionar:


Archivo
Abrir
y marcar una de las opciones del men emergente (datos, Sintaxis, Resultados, Proceso, Otro)
para acceder al cuadro de dilogo Abrir archivo.

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 5. Men abrir

Tipos de archivos de datos


SPSS. Abre archivos de datos guardados con formato SPSS, incluyendo SPSS para
Windows, Macintosh, UNIX y el producto SPSS/PC+ para DOS.
SPSS/PC+. Abre archivos de datos de SPSS/PC+.
SYSTAT. Abre archivos de datos de SYSTAT.
SPSS porttil. Abre archivos de datos guardados con formato SPSS porttil. El
almacenamiento de archivos en este formato lleva mucho ms tiempo que guardarlos en
formato SPSS.
Excel. Abre archivos de Excel.
Lotus 1-2-3. Abre archivos de datos guardados en formato 1-2-3 en las versiones 3.0, 2.0 o
1A de Lotus.

Prof. Willer David Chanduv Puicn

SPSS BSICO
SYLK. Abre archivos de datos guardados en formato SYLK (vnculo simblico), un formato
utilizado por algunas aplicaciones de hoja de clculo.
dBASE. Abre archivos con formato dBASE para dBASE IV, dBASE III o III PLUS, o
dBASE II. Cada caso es un registro. Las etiquetas de valor y de variable y las
especificaciones de valores perdidos se pierden si se guarda un archivo en este formato.
Nombre de archivo largo de SAS. Versin de 7-9 para SAS Windows, extensin larga.
Nombre de archivo corto de SAS. Versin de 7-9 para SAS Windows, extensin corta.
SAS v6 para Windows. Versin 6.08 de SAS para Windows y OS2.
SAS v6 para UNIX. Versin 6 de SAS para UNIX (Sun, HP, IBM).
Transporte de SAS. Archivo de transporte de SAS. 23
Texto. Archivo de texto ASCII.
Lectura de archivos de Excel en el Editor de datos
Tipo y ancho de datos. Cada columna es una variable. El tipo de datos y el ancho de cada
variable est determinado por el tipo de datos y el ancho en el archivo de Excel. Si la
columna contiene ms de un tipo de datos (por ejemplo, fecha y numrico), el tipo de datos se
define como cadena y todos los valores se leen como valores de cadena vlidos.
Casillas en blanco. En las variables numricas, las casillas en blanco se convierten en el
valor perdido del sistema indicado por un punto (o una coma). En las variables de cadena, los
espacios en blanco son valores de cadena vlidos y las casillas en blanco se tratan como
valores de cadena vlidos.
Nombres de variable. Si lee la primera fila del archivo de Excel (o la primera fila del rango
especificado) como nombres de variable, los valores que no cumplan las normas de
denominacin de variables se convertirn en nombres de variables vlidos y los nombres
originales se utilizarn como etiquetas de variable. Si no lee nombres de variable del archivo
de Excel, se asignarn nombres de variable por defecto.
Para leer Archivos de bases de datos, seleccionar:
Archivo
Abrir base de datos
Nueva consulta

10

Prof. Willer David Chanduv Puicn

SPSS BSICO
Para acceder al archivo de dilogo Asistente para base de datos. Seleccione el tipo de archivo
que desea abrir (Excel Files) y pulsar el botn siguiente para acceder al cuadro de dilogo
seleccionar base de datos.
Figura 6. Cuadro de dilogo Asistente para base de datos

Una vez pulsado el botn siguiente, en donde se tendr que dar la ruta del archivo en formato
Excel que se desea exportar. Para esto, pulsar el botn Examinar y luego seleccionar el
archivo en Excel. Pulsar el botn Abrir
Figura 7. Cuadro de dilogo Acceso al controlador ODBC

Pulsar el botn Aceptar para acceder al cuadro de dilogo Seleccionar datos. Este cuadro
permite concretar los campos que van a ser incluidos como variables y el orden en el que
deben aparecer en el nuevo archivo de datos.

11

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 8. Asistente para base de datos. Seleccionar datos

Pulsar el botn siguiente para acceder al cuadro de dilogo Limitar la recuperacin de


casos.
Este cuadro de dilogo permite especificar el criterio para seleccionar subconjuntos de casos
(filas). La limitacin de los casos consiste generalmente en rellenar la rejilla de criterios con
uno o varios criterios. Los criterios constan de dos expresiones y de alguna relacin entre
ellas, y devuelven un valor verdadero, falso o perdido para cada caso.

Si el resultado es verdadero, se selecciona el caso.

Si el resultado es falso o perdido, no se selecciona el caso.

La mayora de los criterios utiliza al menos uno de los seis operadores de relacin (<,
>, <=, >=, = y <>).

Las expresiones pueden incluir nombres de campo, constantes, operadores


aritmticos, funciones numricas y de otros tipos, y variables lgicas. Puede utilizar
como variables los campos que no vaya a importar.

12

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 9. Asistente para base de datos, Limitar la recuperacin de casos

Para crear sus criterios necesita por lo menos dos expresiones y una relacin para conectarlas.

Para crear una expresin, coloque el cursor en una casilla de expresin. Puede
escribir nombres de campo, constantes, operadores aritmticos, funciones
numricas y de otros tipos, y variables lgicas. Existen otros mtodos para situar
un campo en una de las casillas de los criterios, como pulsar dos veces en el campo
en la lista de campos, arrastrar el campo desde esta lista o seleccionar un campo en
el men desplegable que se encuentra disponible en cualquier casilla de expresin
activa.

Las dos expresiones suelen estar conectadas mediante un operador relacional, como
pueden ser = o >. Para elegir la relacin, site el cursor en la casilla de relacin y
escriba el operador o seleccinelo en el men desplegable. Las fechas y horas de
las expresiones se deben especificar de un modo especial (incluidas las llaves que
se muestran en los ejemplos):

13

Prof. Willer David Chanduv Puicn

SPSS BSICO
Los literales de fecha se deben especificar usando el formato general: {d aaaa-mm-dd}.

Los literales de hora se deben especificar usando el formato general: {t hh:mm:ss}.

Los literales de fecha/hora (marcas de hora) se deben especificar usando el formato


general: {dt aaaa-mm-dd hh:mm:ss}.

Funciones. SPSS ofrece una seleccin de funciones preincorporadas SQL aritmticas,


lgicas, de cadena, de fecha y de hora. Puede seleccionar una funcin de la lista y arrastrarla
hasta la expresin, o introducir una funcin SQL vlida.
Utilizar muestreo aleatorio. Selecciona una muestra aleatoria de casos de la fuente de datos.
En el caso de grandes fuentes de datos, puede limitar el nmero de casos a una pequea
muestra representativa. De este modo se puede reducir considerablemente el tiempo de
ejecucin de los procedimientos. Si el muestreo aleatorio original se encuentra disponible
para la fuente de datos, resulta ms rpido que el muestreo aleatorio de SPSS dado que este
ltimo an debe leer toda la fuente de datos para extraer una muestra aleatoria.

Aproximadamente (Seleccionar, Muestra aleatoria). Genera una muestra aleatoria


con el porcentaje aproximado de casos indicado.

Exactamente (Seleccionar, Muestra aleatoria). Selecciona una muestra aleatoria


con el nmero de casos especificado a partir del nmero total de casos especificado.
Si el nmero total de casos especificado excede el nmero total de casos presentes en
el archivo de datos, la muestra contendr un nmero menor de casos proporcional al
nmero solicitado.

Pedir el valor al usuario. Permite insertar una solicitud en la consulta para crear una
consulta con parmetros. Cuando un usuario ejecute la consulta se le solicitar que
introduzca los datos aqu especificados. Puede interesarle esta opcin si necesita obtener
diferentes vistas de los mismos datos. Por ejemplo, es posible que desee ejecutar la misma
consulta para ver las cifras de ventas de diversos trimestres fiscales.
Site el cursor en cualquier casilla de expresin y pulse en Pedir el valor al usuario para crear
una peticin.

14

Prof. Willer David Chanduv Puicn

SPSS BSICO
Nota: Si utiliza el muestreo aleatorio, agregacin (disponible en el modo distribuido con el
servidor de SPSS) no estar disponible.
Definicin de variables
Nombres y etiquetas de variables. El nombre completo del campo (columna) de la base de
datos se utiliza como etiqueta de la variable. A menos que modifique el nombre de la
variable, el Asistente para bases de datos asignar nombres de variable a cada columna de la
base de datos de una de las siguientes formas:

Si el nombre del campo de la base de datos forma un nombre de variable vlido y


nico, se usar como el nombre de la variable.

Si el nombre del campo de la base de datos no es un nombre de variable vlido y


nico, se generar automticamente un nombre nico.

Pulse en cualquier casilla para editar el nombre de la variable.


Conversin de cadenas en variables numricas. Active la casilla Recodificar como
numrica para convertir automticamente una variable de cadena en una variable numrica.
Los valores de cadena se convierten en valores enteros consecutivos en funcin del orden
alfabtico de los valores originales. Los valores originales se mantienen como etiquetas de valor
para las nuevas variables.
Anchura para los campos de ancho variable. Controla la anchura de los valores de las cadenas de

anchura variable. Por defecto, la anchura es de 255 bytes y slo se leen los primeros 255 bytes
(generalmente 255 caracteres en idiomas de un solo byte).
El valor mximo que se puede asignar a este parmetro es de 32.767 bytes. Aunque es probable que desee
truncar los valores de cadena, tampoco querr especificar un valor innecesariamente alto, ya que
provocara una merma en el rendimiento del procesamiento de SPSS.

15

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 10. Asistente para base de datos, Definir variables

Resultados
El cuadro de dilogo Resultados muestra la instruccin Select de SQL para la consulta.

Se puede editar la instruccin Select de SQL antes de ejecutar la consulta, pero si


pulsa el botn Anterior para introducir cambios en pasos anteriores, se perdern los
cambios realizados en la instruccin Select.

Se puede guardar la consulta para una futura utilizacin con Guardar la consulta en un
archivo.

Seleccione Pegarlo en el editor de sintaxis para su modificacin ulterior para pegar la


sintaxis de GET DATA completa en una ventana de sintaxis. Copiar y pegar la
instruccin Select de la ventana Resultados no pegar la sintaxis de comandos
necesaria.

Nota: La sintaxis pegada contiene un espacio en blanco delante de las comillas de cierre en
cada lnea de SQL generado por el asistente. Estos espacios no son superfluos. Cuando se
procesa el comando, todas las lneas de la instruccin SQL se fusionan de un modo muy
literal. Si esos espacios, los caracteres ltimo y primero de cada lnea se uniran.

16

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 11. Asistente para base de datos, Resultados

ASISTENTE PARA LA IMPORTACIN DE TEXTO


El Asistente para la importacin de texto puede leer archivos de datos de texto de diversos
formatos:

Archivos delimitados por tabuladores

Archivos delimitados por espacios

Archivos delimitados por comas

Archivos con formato de campos fijos

En los archivos delimitados, tambin se pueden especificar otros caracteres como


delimitadores entre valores, o bien especificar varios delimitadores diferentes.
Para leer archivos de datos de texto
Elija en los mens:
Archivo
Leer datos de texto

17

Prof. Willer David Chanduv Puicn

SPSS BSICO

Seleccione el archivo de texto en el cuadro de dilogo Abrir.

Siga los pasos indicados en el Asistente para la importacin de texto para definir
cmo desea leer el archivo de datos de texto.

Figura 12. Leer datos de texto

Asistente para la lectura de archivos de datos de Texto


Asistente para la importacin de texto: Paso 1
Figura 13. Asistente para la importacin de texto: Paso 1

El archivo de texto se mostrar en una ventana de vista previa. Puede aplicar un formato
predefinido (guardado con anterioridad desde el Asistente para la importacin de texto) o
seguir los pasos del asistente para especificar cmo desea que se lean los datos.

18

Prof. Willer David Chanduv Puicn

SPSS BSICO
Asistente para la importacin de texto: Paso 2
Figura 14. Asistente para la importacin de texto: Paso 2

Este paso ofrece informacin sobre las variables. Una de las variables es similar a uno de los
campos de la base de datos. Por ejemplo, cada elemento de un cuestionario es una variable.
Cmo estn organizadas sus variables? Para leer los datos adecuadamente, el Asistente
para la importacin de texto necesita saber cmo determinar el lugar en el que terminan los
valores de datos de una variable y comienzan los valores de datos de la variable siguiente. La
organizacin de las variables define el mtodo utilizado para diferenciar una variable de la
siguiente.

Delimitado. Se utilizan espacios, comas, tabulaciones u otros caracteres para separar


variables. Las variables quedan registradas en el mismo orden para cada caso, pero no
necesariamente conservando la misma ubicacin para las columnas.

Ancho fijo. Cada variable se registra en la misma posicin de columna en el mismo


registro (lnea) para cada caso del archivo de datos. No se requiere delimitador entre
variables De hecho, en muchos archivos de datos de texto generados por programas
de ordenador, podra parecer que los valores de los datos se suceden, sin espacios que
los separen. La ubicacin de la columna determina qu variable se est leyendo.

Estn incluidos los nombres de las variables en la parte superior del archivo? Si la
primera fila del archivo de datos contiene etiquetas descriptivas para cada variable, podr
utilizar dichas etiquetas como nombres de las variables. Los valores que no cumplan las
normas de denominacin de variables se convertirn en nombres de variables vlidos.

19

Prof. Willer David Chanduv Puicn

SPSS BSICO
Asistente para la importacin de texto: Paso 3 (Archivos delimitados)
Figura 15. Asistente para la importacin de texto: Paso 3 (Archivos delimitados)

Este paso ofrece informacin sobre los casos. Un caso es similar a un registro de una base de
datos. Por ejemplo, cada persona que responde a un cuestionario es un caso.
En qu nmero de lnea comienza el primer caso de datos? Indica la primera lnea del
archivo de datos que contiene valores de datos. Si la lnea o lneas superiores del archivo de
datos contienen etiquetas descriptivas o cualquier otro texto que no represente valores de
datos, dicha lnea o lneas no sern la lnea 1.
Cmo se representan sus casos? Controla la manera en que el Asistente para la
importacin de texto determina dnde finaliza cada caso y comienza el siguiente.

Cada lnea representa un caso. Cada lnea contiene un slo caso. Es bastante comn
que cada lnea (fila) contenga un slo caso, aunque dicha lnea puede ser muy larga
para un archivo de datos con un gran nmero de variables. Si no todas las lneas
contienen el mismo nmero de valores de datos, el nmero de variables para cada
caso quedar determinado por la lnea que tenga el mayor nmero de valores de datos.
A los casos con menos valores de datos se les asignarn valores perdidos para las
variables adicionales.

20

Prof. Willer David Chanduv Puicn

SPSS BSICO

Un nmero concreto de variables representa un caso. El nmero de variables


especificado para cada caso informa al Asistente para la importacin de texto de
dnde detener la lectura de un caso y comenzar la del siguiente. Una misma lnea
puede contener varios casos y los casos pueden empezar en medio de una lnea y
continuar en la lnea siguiente. El Asistente para la importacin de texto determina el
final de cada caso basndose en el nmero de valores ledos, independientemente del
nmero de lneas. Cada caso debe contener valores de datos (o valores perdidos
indicados por delimitadores) para todas las variables; de otra forma, el archivo de
datos no se leer correctamente.

Cuntos casos desea importar? Puede importar todos los casos del archivo de datos, los
primeros n casos (siendo n un nmero especificado por el usuario) o una muestra aleatoria a
partir de un porcentaje especificado. Dado que esta rutina de muestreo aleatorio toma una
decisin pseudo-aleatoria para cada caso, el porcentaje de casos seleccionados slo se puede
aproximar al porcentaje especificado. Cuantos ms casos contenga el archivo de datos, ms
se acercar el porcentaje de casos seleccionados al porcentaje especificado.
Asistente para la importacin de texto: Paso 3 (Archivos de ancho fijo)
Figura 16. Asistente para la importacin de texto: Paso 3 (Archivos de ancho fijo)

21

Prof. Willer David Chanduv Puicn

SPSS BSICO
Este paso ofrece informacin sobre los casos. Un caso es similar a un registro de una base de
datos. Por ejemplo, cada encuestado es un caso.
En qu nmero de lnea comienza el primer caso de datos? Indica la primera lnea del
archivo de datos que contiene valores de datos. Si la lnea o lneas superiores del archivo de
datos contienen etiquetas descriptivas o cualquier otro texto que no represente valores de
datos, dicha lnea o lneas no sern la lnea 1.
Cuntas lneas representan un caso? Controla la manera en que el Asistente para la
importacin de texto determina dnde finaliza cada caso y comienza el siguiente. Cada
variable queda definida por su nmero de lnea dentro del caso y por la ubicacin de su
columna. Para leer los datos correctamente, deber especificar el nmero de lneas de cada
caso.
Cuntos casos desea importar? Puede importar todos los casos del archivo de datos, los
primeros n casos (siendo n un nmero especificado por el usuario) o una muestra aleatoria a
partir de un porcentaje especificado. Dado que esta rutina de muestreo aleatorio toma una
decisin pseudo-aleatoria para cada caso, el porcentaje de casos seleccionados slo se puede
aproximar al porcentaje especificado. Cuantos ms casos contenga el archivo de datos, ms
se acercar el porcentaje de casos seleccionados al porcentaje especificado.
Asistente para la importacin de texto: Paso 4 (Archivos delimitados)
Figura 17. Asistente para la importacin de texto: Paso 4 (Archivos delimitados)

22

Prof. Willer David Chanduv Puicn

SPSS BSICO
Este paso muestra la mejor opcin, segn el Asistente para la importacin de texto, para leer
el archivo de datos y le permite modificar la manera en que el asistente leer las variables del
archivo de datos.
Qu delimitador desea para la separacin entre variables? Indica los caracteres o
smbolos que separan los valores de datos. Puede seleccionar cualquier combinacin de
espacios, comas, signos de punto y coma, tabulaciones o cualquier otro carcter. En caso de
existir varios delimitadores consecutivos sin valores de datos, dichos delimitadores sern
considerados valores perdidos.
Cul es el calificador de texto? Caracteres utilizados para encerrar valores que contienen
caracteres delimitadores. Por ejemplo, si una coma es el delimitador, los valores que
contengan comas se leern incorrectamente a menos que estos valores se encierre en un
calificador de texto, impidiendo que las comas del valor se interpreten como delimitadores
entre los valores. Los archivos de datos con formato CSV de Excel utilizan las comillas
dobles () como calificador de texto. El calificador de texto aparece tanto al comienzo como
al final del valor, encerrndolo completamente.
Asistente para la importacin de texto: Paso 4 (Archivos de ancho fijo)
Figura 18. Asistente para la importacin de texto: Paso 4 (Archivos de ancho fijo)

23

Prof. Willer David Chanduv Puicn

SPSS BSICO
Este paso muestra la mejor opcin, segn el Asistente para la importacin de texto, para leer
el archivo de datos y le permite modificar la manera en que el asistente leer las variables del
archivo de datos. Las lneas verticales de la ventana de vista previa indican el lugar en el que
en ese momento el Asistente para la importacin de texto piensa que cada variable comienza
en el archivo.
Inserte, mueva y elimine lneas de ruptura de variable segn convenga para separar variables.
Si para cada caso se utilizan varias lneas, seleccione cada lnea de la lista desplegable y
modifique las lneas de ruptura de variable segn convenga.
Asistente para la importacin de texto: Paso 5
Figura 19. Asistente para la importacin de texto: Paso 5

Este paso controla el nombre de la variable y el formato de datos que el Asistente para la
importacin de texto utilizar para leer cada variable, as como las que se incluirn en el
archivo de datos definitivo.

24

Prof. Willer David Chanduv Puicn

SPSS BSICO
Nombre de variable. Puede sobrescribir los nombres de variable por defecto y sustituirlos
por otros diferentes. Si lee nombres de variable desde el archivo de datos, el Asistente para la
importacin de texto modificar de manera automtica los nombres de variable que no
cumplan las normas de denominacin de variables. Seleccione una variable en la ventana de
vista previa e introduzca un nombre de variable.
Formato de datos. Seleccione una variable en la ventana de vista previa y, a continuacin,
seleccione un formato de la lista desplegable. Pulse el botn del ratn con la tecla MAYS
presionada para seleccionar una serie de variables consecutivas, o bien con la tecla CTRL
presionada para seleccionar una serie de variables no consecutivas.
Opciones para el formato de datos
Entre las opciones de formato para la lectura de variables con el Asistente para la importacin
de texto se encuentran:
No importar. Omite la variable o variables seleccionadas del archivo de datos importado.
Numrico. Los valores vlidos incluyen nmeros, los signos ms y menos iniciales y un
indicador decimal.
Cadena. Son valores vlidos prcticamente todos los caracteres del teclado y los espacios en
blanco incrustados. En los archivos delimitados, puede especificar hasta un mximo de
32.767 de caracteres para el valor. El Asistente para la importacin de texto fija como valor
por defecto para el nmero de caracteres el valor de cadena ms largo que se haya encontrado
para la variable o variables seleccionadas. Para los archivos de ancho fijo, el nmero de
caracteres en los valores de cadena queda definido por la ubicacin de las lneas de ruptura de
variable en el paso 4.

25

Prof. Willer David Chanduv Puicn

SPSS BSICO
Fecha/hora. Entre los valores vlidos se encuentran las fechas con formato general: dd-mmaaaa, mm/dd/aaaa, dd.mm.aaaa, aaaa/mm/dd, hh:mm:ss, as como una amplia variedad de
formatos de hora y fecha. Los meses se pueden representar en dgitos, nmeros romanos,
abreviaturas de tres letras o con el nombre completo. Seleccione un formato de fecha de la
lista.
Dlar. Los valores vlidos son nmeros con un signo dlar inicial optativo y puntos
separadores de millares tambin optativos.
Coma. Entre los valores vlidos se encuentran los nmeros que utilizan un punto para separar
los decimales y una coma para separar los millares.
Punto. Entre los valores vlidos se encuentran los nmeros que utilizan una coma para
separar los decimales y un punto para separar los millares.
Nota: Los valores que contengan caracteres no vlidos para el formato seleccionado sern
considerados valores perdidos. Los valores que contengan uno cualquiera de los
delimitadores especificados sern considerados como valores mltiples.
Asistente para la importacin de texto: Paso6
Figura 20. Asistente para la importacin de texto: Paso 6

26

Prof. Willer David Chanduv Puicn

SPSS BSICO
Este es el paso final del Asistente para la importacin de texto. Puede guardar sus propias
especificaciones en un archivo para hacer uso de ellas cuando importe archivos de datos de
texto similares. Tambin puede pegar la sintaxis generada por el Asistente para la
importacin de texto en una ventana de sintaxis. As podr personalizar y/o guardar dicha
sintaxis para utilizarla en futuras sesiones o en trabajos de produccin.

EDITOR DE DATOS
El Editor de datos proporciona un mtodo prctico (al estilo de las hojas de clculo) para la
creacin y edicin de archivos de datos. La ventana Editor de datos se abre automticamente
cuando se inicia una sesin.
El Editor de datos proporciona dos vistas de los datos.

Vista de datos. Esta vista muestra los valores de datos reales o las etiquetas de valor
definidas.

Vista de variables. Esta vista muestra la informacin de definicin de las variables,


que incluye las etiquetas de la variable definida y de valor, tipo de dato (por ejemplo,
cadena, fecha o numrico), nivel de medida (nominal, ordinal o de escala) y los
valores perdidos definidos por el usuario.

En ambas vistas, se puede aadir, modificar y eliminar la informacin contenida en el archivo


de datos.
Vista de datos
Figura 21: Vista de datos

27

Prof. Willer David Chanduv Puicn

SPSS BSICO
Muchas de las funciones de la Vista de datos son similares a las que se encuentran en
aplicaciones de hojas de clculo. Sin embargo, existen varias diferencias importantes:

Las filas son casos. Cada fila representa un caso o una observacin. Por ejemplo, cada
individuo que responde a un cuestionario es un caso.

Las columnas son variables. Cada columna representa una variable o una
caracterstica que se mide. Por ejemplo, cada elemento en un cuestionario es una
variable.

Las casillas contienen valores. Cada casilla contiene un valor nico de una variable
para cada caso. La casilla se encuentra en la interseccin del caso y la variable. Las
casillas slo contienen valores de datos. A diferencia de los programas de hoja de
clculo, las casillas del Editor de datos no pueden contener frmulas.

El archivo de datos es rectangular. Las dimensiones del archivo de datos vienen


determinadas por el nmero de casos y de variables. Se pueden introducir datos en
cualquier casilla. Si introduce datos en una casilla fuera de los lmites del archivo de
datos definido, el rectngulo de datos se ampliar para incluir todas las filas y
columnas situadas entre esa casilla y los lmites del archivo. No hay casillas vacas
en los lmites del archivo de datos. Para variables numricas, las casillas vacas se
convierten en el valor perdido del sistema. Para variables de cadena, un espacio en
blanco se considera un valor vlido.

Vista de variables
Figura 22. Vista de variables

28

Prof. Willer David Chanduv Puicn

SPSS BSICO
La Vista de variables contiene descripciones de los atributos de cada variable del archivo de
datos. En la Vista de variables:

Las filas son variables.

Las columnas son atributos de las variables.

Se pueden aadir o eliminar variables, y modificar los atributos de las variables, incluidos los
siguientes:

Nombre de variable

Tipo de datos

Nmero de dgitos o caracteres

Nmero de decimales

Las etiquetas descriptivas de variable y de valor

Valores perdidos definidos por el usuario

Ancho de columna.

Nivel de medida

Todos estos atributos se guardan al guardar el archivo de datos.


Adems de la definicin de propiedades de variables en la Vista de variables, hay dos otros
mtodos para definir las propiedades de variables:

El Asistente para la copia de propiedades de datos ofrece la posibilidad de utilizar un


archivo de datos de SPSS externo u otro conjunto de datos que est disponible en la
sesin actual como plantilla para definir las propiedades del archivo y las variables
del conjunto de datos activo. Tambin puede utilizar variables del conjunto de datos
activo como plantillas para otras variables del conjunto de datos activo. La opcin
Copiar propiedades de datos est disponible en el men Datos en la ventana Editor de
datos.

29

Prof. Willer David Chanduv Puicn

SPSS BSICO

La opcin Definir propiedades de variables (tambin disponible en el men Datos de


la ventana Editor de datos) explora los datos y muestra una lista con todos los valores
de datos nicos para las variables seleccionadas, indica los valores sin etiquetas y
ofrece una funcin de etiquetas automticas. Este mtodo es especialmente til para
las variables categricas que utilizan cdigos numricos para representar las
categoras (por ejemplo, 0 = hombre, 1 = mujer.

Nombres de variable
Para los nombres de variable se aplican las siguientes normas:

Cada nombre de variable debe ser nico; no se permiten duplicados.

Los nombres de variable pueden tener una longitud de hasta 64 bytes y el primer
carcter debe ser una letra o uno de estos caracteres: @, # o $. Los caracteres
posteriores puede ser cualquier combinacin de letras, nmeros, un punto (.) y
caracteres que no sean signos de puntuacin. Sesenta y cuatro bytes suelen equivaler a
64 caracteres en idiomas de un solo byte (por ejemplo, ingls, francs, alemn,
espaol, italiano, hebreo, ruso, griego, rabe y tailands) y 32 caracteres en los
idiomas de dos bytes (por ejemplo, japons, chino y coreano). escribir palabras
normales en los idiomas admitidos en el juego de caracteres de la plataforma en la que
se est ejecutando SPSS.)

Las variables no pueden contener espacios.

Un carcter # en la primera posicin de un nombre de variable define una variable


transitorio. Slo puede crear variables transitorios mediante la sintaxis de comandos.
No puede especificar un # como primer carcter de una variable en los cuadros de
dilogo que permiten crear nuevas variables.

Un signo $ en la primera posicin indica que la variable es una variable del sistema.
El signo $ no se admite como carcter inicial de una variable definida por el usuario.

30

Prof. Willer David Chanduv Puicn

SPSS BSICO

El punto, el subrayado y los caracteres $, # y @ se pueden utilizar dentro de los


nombres de variable. Por ejemplo, A._$@#1 es un nombre de variable vlido.

Se deben evitar los nombres de variable que terminan con un punto, ya que el punto
puede interpretarse como un terminador del comando. Slo puede crear variables que
finalicen con un punto en la sintaxis de comandos. No puede crear variables que
terminen con un punto en los cuadros de dilogo que permiten crear nuevas variables.

Se deben evitar los nombres de variable que terminan con un carcter de subrayado,
ya que tales nombres puede entrar en conflicto con los nombres de variable creados
automticamente por comandos y procedimientos.

Las palabras reservadas no se pueden utilizar como nombres de variable. Las palabras
reservadas son: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO y WITH.

Los nombres de variable se pueden definir combinando de cualquier manera


caracteres en maysculas y en minsculas, esta distincin entre maysculas y
minsculas se conserva en lo que se refiere a la presentacin.

Cuando es necesario dividir los nombres largos de variable en varias lneas en los
resultados, SPSS intenta dividir las lneas aprovechando los subrayados, los puntos y
cuando el contenido cambia de minsculas a maysculas.

Nivel de medida de variable


Puede especificar el nivel de medida como Escala (datos numricos de una escala de
intervalo o de razn), Ordinal o Nominal. Los datos nominales y ordinales pueden ser de
cadena (alfanumricos) o numricos.

31

Prof. Willer David Chanduv Puicn

SPSS BSICO

nominal. Una variable puede ser tratada como nominal cuando sus valores
representan categoras que no obedecen a una ordenacin intrnseca. Por ejemplo, el
departamento de la compaa en el que trabaja un empleado. Son ejemplos de
variables nominales: la regin, el cdigo postal o la confesin religiosa.

ordinal. Una variable puede ser tratada como ordinal cuando sus valores representan
categoras con alguna ordenacin intrnseca. Por ejemplo los niveles de satisfaccin
con un servicio, que vayan desde muy insatisfecho hasta muy satisfecho. Son
ejemplos de variables las puntuaciones de evaluacin de la preferencia.

escala. Una variable puede ser tratada como de escala cuando sus valores representan
categoras ordenadas con una mtrica con significado, por lo que son adecuadas las
comparaciones de distancia entre valores. Son ejemplos de variables de escala: la
edad en aos y los ingresos en dlares.

Nota: Para variables de cadena ordinales, se asume que el orden alfabtico de los valores de
cadena indica el orden correcto de las categoras. Por ejemplo, en una variable de cadena
cuyos valores sean bajo, medio, alto, se interpreta el orden de las categoras como alto, bajo,
medio (orden que no es el correcto). Por norma general, se puede indicar que es ms fiable
utilizar cdigos numricos para representar datos ordinales.
Para las nuevas variables creadas durante una sesin, los datos ledos de los formatos de
archivo externos y los archivos de datos SPSS creados antes de la versin 8.0, la asignacin
del nivel de medida por defecto se basa en las siguientes reglas:

Las variables numricas con menos de 24 valores nicos y las variables de cadena se
establecen en nominales.

Las variables numricas con 24 o ms valores nicos se establecen en variables de


escala.

32

Prof. Willer David Chanduv Puicn

SPSS BSICO
Tipo de variable
Tipo de variable especifica los tipos de datos de cada variable. Por defecto se asume que
todas las variables nuevas son numricas. Se puede utilizar Tipo de variable para cambiar el
tipo de datos.
El contenido del cuadro de dilogo Tipo de variable depende del tipo de datos seleccionado.
Para algunos tipos de datos, hay cuadros de texto para la anchura y el nmero de decimales;
para otros tipos de datos, simplemente puede seleccionar un formato de una lista desplegable
de ejemplos.
Para definir el tipo de variable
Pulse en el botn de la casilla Tipo de la variable que se quiere definir.
Seleccione el tipo de datos en el cuadro de dilogo Tipo de variable.
Pulse en Aceptar.
Figura 23. Cuadro de dilogo, Tipo de variable

33

Prof. Willer David Chanduv Puicn

SPSS BSICO
Los tipos de datos disponibles son los siguientes:
Numrico. Una variable cuyos valores son nmeros. Los valores se muestran en formato
numrico estndar. El Editor de datos acepta valores numricos en formato estndar o en
notacin cientfica.
Coma. Una variable numrica cuyos valores se muestran con comas que delimitan cada tres
posiciones y con el punto como delimitador decimal. El Editor de datos acepta valores
numricos para este tipo de variables con o sin comas, o bien en notacin cientfica. Los
valores no pueden contener comas a la derecha del indicador decimal.
Punto. Una variable numrica cuyos valores se muestran con puntos que delimitan cada tres
posiciones y con la coma como delimitador decimal. El Editor de datos acepta valores
numricos para este tipo de variables con o sin puntos, o bien en notacin cientfica. Los
valores no pueden contener puntos a la derecha del indicador decimal.
Notacin cientfica. Una variable numrica cuyos valores se muestran con una E intercalada
y un exponente con signo que representa una potencia de base 10. El Editor de datos acepta,
para estas variables, valores numricos con o sin el exponente. El exponente puede aparecer
precedido por una E o una D con un signo opcional, o bien slo por el signo (por ejemplo,
123, 1,23E2, 1,23D2, 1,23E+2 y 1,23+2).
Fecha. Una variable numrica cuyos valores se muestran en uno de los diferentes formatos
de fecha-calendario u hora-reloj. Seleccione un formato de la lista. Puede introducir las
fechas utilizando como delimitadores: barras, guiones, puntos, comas o espacios. El rango de
siglo para los valores de ao de dos dgitos est determinado por la configuracin de las
opciones (en el men Edicin, seleccione Opciones y, a continuacin, pulse en la pestaa
Datos).
Dlar. Una variable numrica que se muestra con un signo dlar inicial ($), comas que
delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden introducir
valores de datos con o sin el signo dlar inicial.
Moneda personalizada. Una variable numrica cuyos valores se muestran en uno de los
formatos de moneda personalizados que se hayan definido previamente en la pestaa Moneda
del cuadro de dilogo Opciones. Los caracteres definidos en la moneda personalizada no se
pueden emplear en la introduccin de datos pero s se mostrarn en el Editor de datos.

34

Prof. Willer David Chanduv Puicn

SPSS BSICO
Cadena. Una variable cuyos valores no son numricos y, por lo tanto, no se utilizan en los
clculos. Los valores pueden contener cualquier carcter siempre que no se exceda la
longitud definida. Las maysculas y las minsculas se consideran diferentes. Este tipo
tambin se conoce como variable alfanumrica.
Etiquetas de variable
Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud (128
caracteres en los idiomas de doble byte). Las etiquetas de variable pueden contener espacios
y caracteres reservados que no se admiten en los nombres de variable.
Para especificar etiquetas de variable
Haga que el editor de datos sea la ventana activa.
Pulse dos veces en un nombre de variable en la parte superior de la columna en
la Vista de datos o bien pulse en la pestaa Vista de variables.
Escriba la etiqueta de variable descriptiva en la casilla Etiqueta de la
variable.
Etiquetas de valor
Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es
especialmente til si el archivo de datos utiliza cdigos numricos para representar categoras
que no son numricas (por ejemplo, cdigos 1 y 2 para hombre y mujer).

Las etiquetas de valor pueden ocupar hasta 120 bytes.

Las etiquetas de valor no estn disponibles para las variables de cadena larga
(variables de cadena de ms de ocho caracteres).

35

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 24. Cuadro de dilogo etiquetas de valor

Para especificar etiquetas de valor


Pulse en el botn de la casilla Valores de la variable que se quiere definir.
Para cada valor, escriba el valor y una etiqueta.
Pulse en Aadir para introducir la etiqueta de valor.
Pulse en Aceptar.
Valores perdidos
Valores perdidos define los valores de los datos definidos como perdidos por el usuario. Por
ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a
responder de los datos perdidos porque la pregunta no afecta a dicho encuestado. Los valores
de datos que se especifican como perdidos por el usuario aparecen marcados para un
tratamiento especial y se excluyen de la mayora de los clculos.

36

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 25. Cuadro de dilogo valores perdidos

Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto, un


rango de valores perdidos o un rango ms un valor de tipo discreto.

Slo pueden especificarse rangos para las variables numricas.

No se pueden definir valores perdidos para variables de cadena larga (variables de


cadena de ms de ocho caracteres).

Valores perdidos para las variables de cadena. Se considera que son vlidos todos los
valores de cadena, incluidos los valores vacos o nulos, a no ser que se definan explcitamente
como perdidos. Para definir como perdidos los valores nulos o vacos de una variable de
cadena, escriba un espacio en blanco en uno de los campos debajo de la seleccin Valores
perdidos discretos.
Para definir los valores perdidos
Pulse en el botn de la casilla Perdido de la variable que se quiere definir.
Introduzca los valores o el rango de valores que representen los datos perdidos.

37

Prof. Willer David Chanduv Puicn

SPSS BSICO
Ancho de columna
Se puede especificar un nmero de caracteres para el ancho de la columna. Los anchos de
columna tambin se pueden cambiar en la Vista de datos pulsando y arrastrando los bordes de
las columnas.
Los formatos de columna afectan slo a la presentacin de valores en el Editor de datos. Al
cambiar el ancho de columna no se cambia el ancho definido de una variable. Si el ancho real
y definido de un valor es ms ancho que la columna, aparecern asteriscos (*) en la Vista de
datos.
Alineacin de la variable
La alineacin controla la presentacin de los valores de los datos y/o de las etiquetas de valor
en la Vista de datos. La alineacin por defecto es a la derecha para las variables numricas y
a la izquierda para las variables de cadena. Este ajuste slo afecta a la presentacin en la
Vista de datos.
Introduccin de datos
En la Vista de datos, puede introducir datos directamente en el Editor de datos. Se puede
introducir datos en cualquier orden. Asimismo, se pueden introducir datos por caso o por
variable, para reas seleccionadas o para casillas individuales.

Se resaltar la casilla activa.

El nombre de la variable y el nmero de fila de la casilla activa aparecen en la esquina


superior izquierda del Editor de datos.

Cuando seleccione una casilla e introduzca un valor de datos, el valor se muestra en el


editor de casillas situado en la parte superior del Editor de datos.

Los valores de datos no se registran hasta que se pulsa Intro o se selecciona otra
casilla.

Para introducir datos distintos de los numricos, en primer lugar, se debe definir el
tipo de variable. Si introduce un valor en una columna vaca, el Editor de datos crear
automticamente una nueva variable y asignar un nombre de variable.

38

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 26. Vista de datos: conjunto de datos activo

Para introducir datos numricos


Seleccione una casilla en la Vista de datos.
Introduzca el valor de los datos. (El valor se muestra en el editor de casillas situado
en la parte superior del Editor de datos.)
Para registrar el valor, pulse Intro o seleccione otra casilla.
Para introducir datos no numricos
Pulse dos veces en un nombre de variable en la parte superior de la columna en la
Vista de datos o bien pulse en la pestaa Vista de variables.
Pulse en el botn de la casilla Tipo de la variable.
Seleccione el tipo de datos en el cuadro de dilogo Tipo de variable.
Pulse en Aceptar.
Pulse dos veces en el nmero de fila o pulse en la pestaa Vista de datos.
Introduzca en la columna los datos de la variable que se va a definir.

39

Prof. Willer David Chanduv Puicn

SPSS BSICO
Edicin de datos
Con el Editor de datos es posible modificar los valores de datos de la Vista de datos de
muchas maneras. Tiene la posibilidad de:

Cambiar los valores de datos.

Cortar, copiar y pegar valores de datos.

Aadir y eliminar casos.

Aadir y eliminar variables.

Cambiar el orden de las variables.

Cortar, copiar y pegar valores de datos


Puede cortar, copiar y pegar valores de casillas individuales o grupos de valores en el Editor
de datos. Tiene la posibilidad de:

Mover o copiar un nico valor de casilla a otra casilla.

Mover o copiar un nico valor de casilla en un grupo de casillas.

Mover o copiar los valores de un nico caso (fila) en varios casos.

Mover o copiar los valores de una nica variable (columna) en varias variables.

Mover o copiar un grupo de valores de casillas en otro grupo de casillas.

Conversin de datos para valores pegados en el Editor de datos


Si los tipos de variable definidos de las casillas de origen y de destino no son iguales, el
Editor de datos intentar convertir el valor. Si no es posible realizar la conversin, el valor
perdido del sistema se insertar en la casilla de destino.
Conversin de numrico o fecha a cadena. Los formatos numricos (por ejemplo,
numrico, dlar, de punto o de coma) y de fechas se convierten en cadenas si se pegan en una
casilla de variable de cadena. El valor de cadena es el valor numrico tal como se muestra en
la casilla. Por ejemplo, para la variable con formato de dlar, el signo dlar que se muestra se
convierte en parte del valor de cadena. Los valores que sobrepasan el ancho de la variable de
cadena definida quedan cortados.

40

Prof. Willer David Chanduv Puicn

SPSS BSICO
Conversin de cadena a numrico o fecha. Los valores de cadena que contienen caracteres
admisibles por el formato numrico o de fecha de la casilla de destino se convierten al valor
numrico o de fecha equivalente. Por ejemplo, un valor de cadena de 25/12/91 se convierte a
una fecha vlida si el tipo de formato de la casilla de destino es uno de los formatos da-mesao, pero se convierte en perdido por el sistema si el tipo de formato de la casilla de destino
es uno de los formatos mes-da-ao.
Conversin de fecha a numrico. Los valores de fecha y hora se convierten a un nmero de
segundos si la casilla de destino es uno de los formatos numricos (por ejemplo, numrico,
dlar, de punto o de coma). Al almacenarse internamente las fechas como el nmero de
segundos transcurridos desde el 14 de octubre de 1582, la conversin de fechas a valores
numricos puede generar nmeros extremadamente grandes. Por ejemplo, la fecha 10/29/91
se convierte al valor numrico 12.908.073.600.
Conversin de numrico a fecha u hora. Los valores numricos se convierten a fechas u
horas si el valor representa un nmero de segundos que puede producir una fecha u hora
vlidos. Para las fechas, los valores numricos menores que 86.400 se convierten al valor
perdido del sistema.
Insercin de nuevos casos
Al introducir datos en una casilla de una fila vaca, se crea automticamente un nuevo caso.
El Editor de datos inserta el valor perdido del sistema para el resto de las variables de dicho
caso. Si hay alguna fila vaca entre el nuevo caso y los casos existentes, las filas en blanco
tambin se convierten en casos nuevos con el valor perdido del sistema para todas las
variables. Tambin puede insertar nuevos casos entre casos existentes.
Para insertar nuevos casos entre los casos existentes
En la Vista de datos, seleccione cualquier casilla del caso (fila) debajo de la posicin
donde desea insertar el nuevo caso.
Elija en los mens:
Edicin
Insertar casos

41

Prof. Willer David Chanduv Puicn

SPSS BSICO
Se inserta una fila nueva para el caso y todas las variables reciben el valor perdido del
sistema.
Insercin de nuevas variables
La introduccin de datos en una columna vaca en la Vista de datos o en una fila vaca en la
Vista de variables crea de forma automtica una variable nueva con un nombre de variable
por defecto (el prefijo var y un nmero secuencial) y un tipo de formato de datos por defecto
(numrico). El Editor de datos inserta el valor perdido del sistema en todos los casos de la
nueva variable. Si hay columnas vacas en la Vista de datos o filas vacas en la Vista de
variables entre la nueva variable y las variables existentes, estas filas o columnas tambin se
convierten en nuevas variables con el valor perdido del sistema para todos los casos. Tambin
se pueden insertar variables nuevas entre las variables existentes.
Para insertar nuevas variables entre variables existentes
Seleccione cualquier casilla de la variable a la derecha (Vista de datos) o debajo (Vista
de variables) de la posicin donde desea insertar la nueva variable.
Elija en los mens:
Edicin
Insertar variable
Se insertar una nueva variable con el valor perdido del sistema para todos los casos.
Para mover variables
Para seleccionar la variable, pulse en el nombre de variable de la Vista de datos o en
el nmero de fila para la variable de la Vista de variables.
Arrastre y suelte la variable en la nueva ubicacin.
Si desea colocar la variable entre dos ya existentes: En la Vista de datos, arrastre la
variable sobre la columna de variables a la derecha del lugar donde desea colocar la
variable, o en la Vista de variables, arrastre la variable a la fila de variables debajo
de donde desee colocarla.

42

Prof. Willer David Chanduv Puicn

SPSS BSICO
Para cambiar el tipo de datos
Puede cambiar el tipo de datos de una variable en cualquier momento mediante el cuadro de
dilogo Tipo de variable de la Vista de variables. El Editor de datos intentar convertir los
valores existentes en el nuevo tipo. Si no se puede realizar esta conversin, se asignar el
valor perdido del sistema. Las reglas de conversin son las mismas que las del pegado de
valores de datos en una variable con distinto tipo de formato. Si el cambio del formato de los
datos puede generar la prdida de las especificaciones de valores perdidos o de las etiquetas
de valor, el Editor de datos mostrar un cuadro de alerta solicitando confirmacin para
proseguir o cancelar la operacin.
Ir a caso
El cuadro de dilogo Ir a caso permite ir al nmero de caso (fila) especificado en el Editor de
datos.
Figura 27. Cuadro de dilogo ir a caso

Para buscar un caso en el Editor de datos


Haga que el editor de datos sea la ventana activa.
Elija en los mens:
Datos
Ir a caso...
En el cuadro de dilogo Ir a caso, introduzca el nmero de fila del Editor de datos
para el caso.

43

Prof. Willer David Chanduv Puicn

SPSS BSICO

PREPARACIN DE DATOS
Propiedades de variables
Los datos introducidos en la Vista de datos del Editor de datos o ledos en SPSS desde un
formato de archivos externo (como una hoja de clculo de Excel o un archivo de datos de
texto) carecen de ciertas propiedades de variables que pueden resultar muy tiles, como:

Definicin de etiquetas de valor descriptivas para cdigos numricos (por ejemplo, 0


= Hombre y 1 = Mujer).

Identificacin de cdigos de valores perdidos (por ejemplo, 99 = No procede).

Asignacin del nivel de medida (nominal, ordinal o de escala).

Todas estas propiedades de variables (y otras) se pueden asignar en la Vista de variables del
Editor de datos. Tambin hay algunas utilidades que le pueden ofrecer asistencia en este
proceso:

Definir propiedades de variables puede ayudarle a definir etiquetas de valor


descriptivas y valores perdidos. Esto es especialmente til para datos categricos con
cdigos numricos utilizados para valores de categoras.

Copiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos


con formato SPSS como plantilla para definir las propiedades de variables y archivos
en el archivo de datos actual. Esto es particularmente til si utiliza frecuentemente
archivos de datos con un formato externo que tenga un contenido similar, como
puedan ser informes mensuales en formato Excel.

44

Prof. Willer David Chanduv Puicn

SPSS BSICO

Definicin de propiedades de variables


Definir propiedades de variables est diseado para ayudarle en el proceso de creacin de
etiquetas de valor descriptivas para variables categricas (nominales u ordinales). Definir
propiedades de variables:

Explora los datos reales y enumera todos valores de datos nicos para cada variable
seleccionada.

Identifica valores sin etiquetas y ofrece una funcin de etiquetas automticas.

Permite copiar etiquetas de valor definidas de otra variable en la variable seleccionada


o de la variable seleccionada a varias variables adicionales.

Nota: Para utilizar Definir propiedades de variables sin explorar primero los casos, introduzca
0 para el nmero de casos que se van a explorar.
Para definir propiedades de variables
Elija en los mens:
Datos
Definir propiedades de variables...
Figura 28. Cuadro de dilogo inicial para seleccionar las variables que se van a definir

45

Prof. Willer David Chanduv Puicn

SPSS BSICO

Seleccione las variables numricas o de cadena corta para las que desea crear
etiquetas de valor o definir o cambiar otras propiedades de las variables, como los
valores perdidos o las etiquetas de variable descriptivas.
Nota: Las variables de cadena largas (variables de cadena con una anchura definida de ms
de ocho caracteres) no se visualizan en la lista de variables. Las variables de cadena largas no
pueden tener etiquetas de valor definidas ni categoras de valores perdidos.
Especificar el nmero de casos que se van a explorar para generar la lista de valores
nicos. resulta especialmente til para los archivos de datos con mayor nmero de
casos, para el cual una exploracin del archivo de datos completo podra tardar una
gran cantidad de tiempo.
Especifique un lmite superior para el nmero de valores nicos que se va a
visualizar. Esto es especialmente til para evitar que se generen listas de cientos,
miles o incluso millones de valores para las variables de escala (intervalo continuo,
razn).
Pulse en Continuar para abrir el cuadro de dilogo Definir propiedades de variables
principal.
Seleccione una variable para la que desee crear etiquetas de valor o definir o cambiar
otras propiedades de las variables.
Introduzca el texto de etiqueta para los valores sin etiquetas que se visualicen en
Rejilla etiqueta valores.
Si hay valores para los que desea crear etiquetas de valor, pero no se visualizan
dichos valores, puede introducirlos en la columna Valores por debajo del ltimo
valor explorado.

46

Prof. Willer David Chanduv Puicn

SPSS BSICO
Repita este proceso para cada variable de la lista para la que desee crear etiquetas de
valor.
Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las
variables.
Definicin de etiquetas de valor y otras propiedades de las variables
Figura 29. Cuadro de dilogo principal Definir propiedades de variables

El cuadro de dilogo principal Definir propiedades de variables proporciona la siguiente


informacin para las variables exploradas:
Lista de variables exploradas. Para cada variable explorada, aparecer una marca de
verificacin en la columna Sin etiqueta (U.) indicando que la variable contiene valores sin
etiquetas de valor asignadas. Para ordenar la lista de variables para que aparezcan todas las
variables con valores sin etiquetas en la parte superior de la lista:
Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables
exploradas.

47

Prof. Willer David Chanduv Puicn

SPSS BSICO
Tambin puede ordenarla por nombre de variable o nivel de medida pulsando en el
encabezado de columna correspondiente debajo de la Lista de variables exploradas.
Rejilla etiqueta valores

Etiqueta. Muestra las etiquetas de valor que ya se han definido. Puede aadir o
cambiar las etiquetas de esta columna.

Valor. Valores nicos para cada variable seleccionada. Esta lista de valores nicos se
basa en el nmero de casos explorados. Por ejemplo, si slo ha explorado los
primeros 100 casos del archivo de datos, la lista reflejar slo los valores nicos
presentes en esos casos. Si el archivo de datos ya se ha ordenado por la variable para
la que desea asignar etiquetas de valor, la lista puede mostrar muchos menos valores
nicos de los que hay realmente presentes en los datos.

Recuento. Nmero de veces que aparece cada valor en los casos explorados.

Perdidos. Valores definidos para representar valores perdidos. Puede cambiar la


designacin de la categora de los valores perdidos pulsando en la casilla de
verificacin. Una marca indica que la categora se ha definido como categora perdida
por el usuario. Si una variable ya tiene un rango de valores definidos como perdidos
por el usuario (por ejemplo 90 - 99), no podr aadir ni eliminar categoras de valores
perdidos para esa variable con Definir propiedades de variables. Puede utilizar la
Vista de variables del Editor de datos para modificar las categoras de valores
perdidos para la variable con rangos de valores perdidos.

Cambiado. Indica que ha aadido o cambiado una etiqueta de valor.

Nota: Si ha especificado 0 para el nmero de casos que se van a explorar en el cuadro de


dilogo inicial, la rejilla etiqueta valores estar en blanco al principio, a excepcin de algunas
etiquetas de valor ya existentes y/o categoras de valores perdidos definidas para la variable
seleccionada.
Adems, se desactivar el botn Sugerir para el nivel de medida.
Nivel de medida. Las etiquetas de valor son especialmente tiles para las variables
categricas (nominales u ordinales), y algunos procedimientos tratan a las variables
categricas y de escala de manera diferente, por lo que a veces es importante asignar el nivel
de medida correcto.

48

Prof. Willer David Chanduv Puicn

SPSS BSICO
Sin embargo, por defecto, todas las nuevas variables numricas se asignan al nivel de medida
de escala. Por tanto, puede que muchas variables que son de hecho categricas, aparezcan
inicialmente como variables de escala.
Si no est seguro de qu nivel de medida debe asignar a una variable, pulse en Sugerir.
Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables
de otra variable a la variable seleccionada en ese momento o desde la variable seleccionada
en ese momento a una o varias otras variables.
Valores sin etiquetas. Para crear automticamente etiquetas para valores sin etiquetas, pulse
en Etiquetas automticas.
Puede cambiar de la etiqueta de variable descriptiva y el formato de presentacin.

No puede cambiar el tipo fundamental de la variable (numrica o de cadena).

Para las variables de cadena, slo puede cambiar la etiqueta de variable, no el formato
de presentacin.

Para las variables numricas, puede cambiar el tipo numrico (como numrico, fecha,
dlar o moneda personalizada), el ancho (nmero mximo de dgitos, incluyendo los
indicadores decimales y/o de agrupacin) y el nmero de posiciones decimales.

Para el formato de fecha numrica, puede seleccionar un formato de fecha especfico


(como dd-mm-aaaa, mm/dd/aa y aaaaddd)

Asignacin del nivel de medida


Cuando pulse en Sugerir para seleccionar un nivel de medida en el cuadro de dilogo
principal Definir propiedades de variables, la variable actual se evala en funcin de los
casos explorados y las etiquetas de valor definidas y se sugiere un nivel de medida en el
cuadro de dilogo Sugerir nivel de medida que se abre. El rea Explicacin ofrece una breve
descripcin de los criterios utilizados para proporcionar el nivel de medida sugerido.

49

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 30. Cuadro de dilogo Sugerir nivel de medida

Nota: Los valores definidos para representar valores perdidos no se incluyen en la evaluacin
para el nivel de medida. Por ejemplo, la explicacin del nivel de medida sugerido puede
indicar que la sugerencia se basa, en parte, en el hecho de que la variable no contiene valores
negativos, mientras que, de hecho, puede contener valores negativos, pero dichos valores ya
se han definido como valores perdidos.
Pulse en Continuar para aceptar el nivel de medida sugerido o en Cancelar para
mantener el mismo.

50

Prof. Willer David Chanduv Puicn

SPSS BSICO
Categorizador visual
La categorizador visual est concebida para ayudarle en el proceso de creacin de nuevas
variables basadas en la agrupacin de los valores contiguos de las variables existentes para
dar lugar a un nmero limitado de categoras diferentes. Puede utilizar la categorizador visual
para:

Crear variables categricas a partir de variables de escala continuas. Por ejemplo,


puede utilizar una variable de escala con los ingresos para crear una variable
categrica nueva que contenga intervalos de ingresos.

Colapsar un nmero elevado de categoras ordinales en un conjunto menor de


categoras. Por ejemplo, es posible colapsar una escala de evaluacin de nueve
categoras en tres categoras que representen: bajo, medio y alto.

En el primer paso, puede:


Seleccione las variables numricas de escala u ordinales para las que desee crear
nuevas variables categricas (en agrupaciones).
Figura 31. Cuadro de dilogo inicial para seleccionar variables que se van agrupar

51

Prof. Willer David Chanduv Puicn

SPSS BSICO
Como alternativa puede limitar la cantidad de casos que se van a explorar. Con los archivos
de datos que contengan un elevado nmero de casos, la limitacin del nmero de casos que se
va a explorar puede ahorrar tiempo, pero debe evitarse este procedimiento en lo posible, ya
que afectar a la distribucin de los valores que se utilizarn en los clculos posteriores en la
categorizador visual.
Nota: Las variables de cadena y las variables numricas nominales no se muestran en la lista
de variables origen. La categorizador visual requiere que las variables sean numricas,
medidas bien a nivel ordinal o de escala, puesto que supone que los valores de los datos
representan algn tipo de orden lgico que se puede utilizar para agrupar los valores con
sentido. Puede cambiar el nivel de medida de una variable en la Vista de variables del Editor
de datos.
Para agrupar variables
Seleccione en los mens de la ventana Editor de datos:
Transformar
Categorizador visual...
Seleccione las variables numricas de escala u ordinales para las que desee crear nuevas
variables categricas (en agrupaciones).
Seleccione una variable de la Lista de variables exploradas.
Escriba el nombre de la nueva variable agrupada. Los nombres de variable no pueden
repetirse, y deben seguir las normas de denominacin de variables de SPSS.
Defina los criterios de agrupacin para la nueva variable.
Pulse en Aceptar.

52

Prof. Willer David Chanduv Puicn

SPSS BSICO
Agrupacin de variables
Figura 32. Categorizador visual, cuadro de dilogo principal

El cuadro de dilogo principal de la categorizador visual proporciona la siguiente


informacin sobre las variables exploradas:
Lista de variables exploradas. Muestra las variables que fueron seleccionadas en el cuadro
de dilogo inicial. Puede ordenar la lista por el nivel de medida (de escala u ordinal) o por la
etiqueta o el nombre de variable, pulsando en los encabezados de las columnas.
Casos explorados. Indica el nmero de casos explorados. Todos los casos explorados sin
valores perdidos definidos por el usuario o del sistema para la variable seleccionada, se usan
en la generacin de la distribucin de valores que se emplea en los clculos de la
categorizador visual, incluyendo el histograma que se visualiza en el cuadro de dilogo
principal y los puntos de corte basados en percentiles o unidades de desviacin tpica.

53

Prof. Willer David Chanduv Puicn

SPSS BSICO
Valores perdidos. Indica el nmero de casos explorados con valores perdidos definidos por
el usuario y perdidos del sistema. Los valores perdidos no se incluyen en ninguno de las
categoras agrupadas.
Variable actual. El nombre y etiqueta de variable (si existe) de la variable actualmente
seleccionada y que se usar como base para la nueva variable agrupada.
Variable agrupada. Nombre y etiqueta de variable alternativa para la nueva variable
agrupada.

Nombre. Debe introducir un nombre para la nueva variable. Los nombres de variable
no pueden repetirse, y deben seguir las normas de denominacin de variables de
SPSS.

Etiqueta. Puede introducir una etiqueta de variable descriptiva con una longitud de
hasta 255 caracteres. La etiqueta de variable por defecto ser la etiqueta de variable
(si existe) o el nombre de variable de la variable origen con el texto (Agrupada)
aadido al final de la etiqueta.

Mnimo y Mximo. Valores, mnimo y mximo, para la variable seleccionada actualmente,


basados en los casos explorados y excluyendo los valores definidos como perdidos por el
usuario.
Valores no perdidos. El histograma muestra la distribucin de valores no perdidos
correspondiente a la variable seleccionada actualmente, basndose en los casos explorados.

Despus de haber definido los intervalos para la nueva variable, se mostrarn lneas
verticales en el histograma para indicar los puntos de corte que definen los intervalos.

Puede pulsar y arrastrar las lneas de los puntos de corte a distintos puntos del
histograma, modificando as la amplitud de los intervalos.

Puede eliminar intervalos arrastrando las lneas de los puntos de corte fuera del
histograma.

54

Prof. Willer David Chanduv Puicn

SPSS BSICO
Nota: El histograma (que muestra valores no perdidos), el mnimo y el mximo se basan en
los casos explorados. Si no incluye todos los casos en la exploracin, es posible que no se
refleje con precisin la distribucin real, sobre todo si el archivo de datos se orden segn la
variable seleccionada. Si no explora ningn caso, no encontrar disponible informacin sobre
la distribucin de valores.
Cuadrcula. Muestra los valores que definen los puntos de corte superiores de cada intervalo,
as como las etiquetas de valor opcionales para cada intervalo.

Valor. Valores que definen los puntos de corte superiores en cada intervalo. Puede
introducir los valores o utilizar Crear puntos de corte para crear automticamente los
intervalos basndose en los criterios seleccionados. Por defecto, se incluye
automticamente un punto de corte con el valor SUPERIOR. Este intervalo contendr
cualesquiera valores no perdidos por encima de los restantes puntos de corte. El
intervalo definido por el punto de corte inferior incluir todos los valores no perdidos
que sean menores o iguales que dicho valor (o, sencillamente, inferiores a ese valor,
dependiendo de la forma en que haya definido los puntos de corte superiores).

Etiqueta. Etiquetas opcionales y descriptivas de los valores de la nueva variable


agrupada.

Puesto que los valores de la nueva variable slo sern nmeros enteros en secuencia, del 1 a
n, las etiquetas que describan lo que representan los valores pueden resultar muy tiles.
Puede introducir las etiquetas o usar Crear etiquetas para crear las etiquetas de valor de forma
automtica.
Para eliminar un intervalo de la rejilla
Pulse con el botn derecho en las casillas Valor o Etiqueta del intervalo.
En el men contextual emergente, seleccione Eliminar fila.
Nota: Si elimina el intervalo SUPERIOR, los casos con valores superiores al valor del ltimo
punto de corte especificado recibirn el valor perdido del sistema en la nueva variable.

55

Prof. Willer David Chanduv Puicn

SPSS BSICO
Para eliminar todas las etiquetas o todos los intervalos definidos
Pulse en cualquier parte de la rejilla con el botn derecho del ratn.
En el men contextual emergente, seleccione Eliminar todas las etiquetas o Eliminar
todos los puntos de corte.
Lmites superiores. Controla el tratamiento de los valores de los lmites superiores
introducidos en la columna Valor de la rejilla.

Incluidos (<=). Los casos con el valor especificado en la casilla Valor se incluyen en
la categora agrupada. Por ejemplo, si especifica los valores 25, 50 y 75, los casos con
el valor exacto 25 se incluirn en el primer intervalo, ya que se incluirn todos los
casos con valor menor o igual que 25.

Excluido (<). Los casos con el valor especificado en la casilla Valor no se incluyen
en la categora agrupada. Por el contrario, se incluyen en el siguiente intervalo. Por
ejemplo, si especifica los valores 25, 50 y 75, los casos con el valor exacto 25 se
incluirn en el segundo intervalo en vez de en el primero, puesto que el primero slo
contendr casos con valores inferiores a 25.

Crear puntos de corte. Genera categoras agrupadas automticamente para crear intervalos
de igual amplitud, intervalos con el mismo nmero de casos o intervalos basados en un
nmero de desviaciones tpicas. Esta posibilidad no est disponible si no se ha explorado
ningn caso.
Crear etiquetas. Genera etiquetas descriptivas para los valores enteros consecutivos
contenidos en la nueva variable agrupada, en funcin de los valores de la rejilla y el
tratamiento especificado para los lmites superiores (incluidos o excluidos).
Invertir la escala. Por defecto, los valores de la nueva variable agrupada sern nmeros
enteros consecutivos, del 1 a n. La inversin de la escala convierte los valores en nmeros
enteros consecutivos, de n a 1.
Copiar intervalos. Puede copiar las especificaciones de agrupacin de otra variable a la
variable seleccionada en ese momento, o desde la variable seleccionada en ese momento a
otras varias variables.

56

Prof. Willer David Chanduv Puicn

SPSS BSICO
Generacin automtica de categoras agrupadas
El cuadro de dilogo Crear puntos de corte permite la creacin automtica de categoras
agrupadas en funcin de los criterios seleccionados.
Para utilizar el cuadro de dilogo Crear puntos de corte
Seleccione (pulse) una variable de la Lista de variables exploradas.
Pulse Crear puntos de corte.
Seleccione los criterios de generacin de los puntos de corte que definirn las
categoras agrupadas.
Pulse en Aplicar.
Figura 33. Cuadro de dilogo crear puntos de corte

Nota: El cuadro de dilogo Crear puntos de corte no est disponible si no se ha explorado


ningn caso.

57

Prof. Willer David Chanduv Puicn

SPSS BSICO
Intervalos de igual amplitud. Genera categoras agrupadas de igual amplitud (por ejemplo,
110, 1120 y 2130) basndose en dos (cualesquiera) de los tres criterios siguientes:

Posicin del primer punto de corte. Valor que define el lmite superior de la
categora agrupada inferior (por ejemplo, el valor 10 indica un intervalo que incluya
todos los valores hasta 10).

Nmero de puntos de corte. El nmero de categoras agrupadas es el nmero de


puntos de corte ms uno. Por ejemplo, 9 puntos de corte generan 10 categoras
agrupadas.

Amplitud. La amplitud de cada intervalo. Por ejemplo, el valor 10 agrupar la


variable Edad en aos en intervalos de 10 aos.

Percentiles iguales basados en los casos explorados. Genera categoras agrupadas con un
nmero igual de casos en cada intervalo (utilizando el algoritmo aempirical para el
clculo de percentiles), segn uno de los criterios siguientes:

Nmero de puntos de corte. El nmero de categoras agrupadas es el nmero de


puntos de corte ms uno. Por ejemplo, tres puntos de corte generan cuatro intervalos
percentiles (cuartiles), conteniendo cada uno el 25% de los casos.

% de casos. Amplitud de cada intervalo, expresado en forma de porcentaje sobre el


nmero total de casos. Por ejemplo, el valor 33,3 generara tres categoras agrupadas
(dos puntos de corte), conteniendo cada una el 33,3% de los casos.

Si la variable origen contiene un nmero relativamente pequeo de valores distintos o un gran


nmero de casos con el mismo valor, es posible que obtenga menos intervalos que las
solicitadas.
En caso de haber varios valores idnticos en un punto de corte, todos se incluyen en el mismo
intervalo; por consiguiente, los porcentajes reales pueden no ser siempre iguales.

58

Prof. Willer David Chanduv Puicn

SPSS BSICO

Puntos de corte en media y desviaciones tpicas seleccionadas, basadas en casos


explorados.
Genera categoras agrupadas basndose en los valores de la media y la desviacin tpica de la
distribucin de la variable.

Si no selecciona ninguno de los intervalos de desviacin tpica, se crearn dos


categoras agrupadas, siendo la media el punto de corte que divida los intervalos.

Puede seleccionar cualquier combinacin de los intervalos de desviacin tpica,


basndose en una, dos o tres desviaciones tpicas. Por ejemplo, al seleccionar las tres
opciones se obtendrn ocho categoras agrupadas: seis intervalos distanciados en una
desviacin tpica de amplitud y dos intervalos para los casos que se encuentren a ms
de tres desviaciones tpicas por encima y por debajo de la media.

En una distribucin normal, el 68% de los casos se encuentra dentro de una distancia de una
desviacin tpica respecto a la media, el 95% entre dos desviaciones tpicas y el 99% dentro
de tres desviaciones tpicas. La creacin de categoras agrupadas basadas en desviaciones
tpicas puede ocasionar que algunos intervalos queden definidos fuera del rango real de los
datos, e incluso fuera del rango de valores posibles de los datos (por ejemplo, un rango de
salarios negativos).
Nota: Los clculos de los percentiles y las desviaciones tpicas se basan en los casos
explorados. Si limita el nmero de casos explorados, puede que los intervalos resultantes no
incluyan la proporcin de casos deseada en dichos intervalos, sobre todo si el archivo de
datos se orden segn la variable origen. Por ejemplo, si limita la exploracin a los primeros
100 casos de un archivo de datos con 1000 casos y el archivo de datos est ordenado en orden
descendente por edad del encuestado, en lugar de cuatro intervalos percentiles de la edad,
cada uno con el 25% de los casos, podra encontrarse con que los tres primeros intervalos
contuvieran cada una slo en torno al 3,3% de los casos, mientras que el ltimo intervalo
albergara el 90% de los casos.

59

Prof. Willer David Chanduv Puicn

SPSS BSICO
Valores perdidos definidos por el usuario en la categorizador visual
Los valores perdidos definidos por el usuario (valores identificados como los cdigos para los
datos perdidos) para la variable origen no se incluyen en las categoras agrupadas de la nueva
variable. Los valores perdidos definidos por el usuario de las variables se copian como
valores perdidos definidos por el usuario en la nueva variable, copindose tambin cualquier
otra etiqueta de valor definida para los cdigos de los valores perdidos.
Si un cdigo de valor perdido entra en conflicto con alguno de los valores de categoras
agrupadas de la nueva variable, el cdigo de valor perdido de la nueva variable se
recodificar a un valor no conflictivo, sumando 100 al valor de categora agrupada superior.
Por ejemplo, si el usuario define el valor 1 como valor perdido para la variable origen y la
nueva variable va a contar con seis categoras agrupadas, cualquier caso con el valor 1 en la
variable origen tendr el valor 106 en la nueva variable, y 106 ser definido como un valor
definido como perdido por el usuario. Si el valor definido como perdido por el usuario en la
variable de origen tena definida una etiqueta de valor, dicha etiqueta se mantendr como
etiqueta de valor para el valor recodificado de la nueva variable.
Nota: Si la variable de origen tiene definido un rango de valores perdidos de usuario con la
forma MENOR-n, donde n es un nmero positivo, los valores perdidos definidos por el
usuario correspondientes a la nueva variable, sern nmeros negativos.

60

Prof. Willer David Chanduv Puicn

SPSS BSICO

TRANSFORMACIONES DE LOS DATOS


En una situacin ideal, los datos brutos son perfectamente apropiados para el tipo de anlisis
que se desea realizar y cualquier relacin existente entre las variables o es adecuadamente
lineal o es claramente ortogonal. Desafortunadamente, esto ocurre pocas veces. El anlisis
preliminar puede revelar esquemas de codificacin poco prcticos o errores de codificacin, o
bien pueden requerirse transformaciones de los datos para exponer la verdadera relacin
existente entre las variables.
Puede realizar transformaciones de los datos de todo tipo, desde tareas sencillas, como la
agrupacin de categoras para su anlisis posterior, hasta otras ms avanzadas, como la
creacin de nuevas variables basadas en ecuaciones complejas e instrucciones condicionales.
Clculo de variables
Utilice el cuadro de dilogo Calcular para calcular los valores de una variable basndose en
transformaciones numricas de otras variables.

Puede calcular valores para las variables numricas o de cadena (alfanumricas).

Puede crear nuevas variables o bien reemplazar los valores de las variables existentes.
Para las nuevas variables, tambin se puede especificar el tipo y la etiqueta de
variable.

Puede calcular valores de forma selectiva para subconjuntos de datos basndose en


condiciones lgicas.

Puede utilizar ms de 70 funciones preincorporadas, incluyendo funciones


aritmticas, funciones estadsticas, funciones de distribucin y funciones de cadena.

61

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 34. Cuadro de dilogo calcular variable

Para calcular variables


Elija en los mens:
Transformar
Calcular variable...
Escriba el nombre de una sola variable de destino. Puede ser una variable existente o
una nueva que se vaya a aadir al conjunto de datos activo.
Para crear una expresin, puede pegar los componentes en el campo Expresin o
escribir directamente en dicho campo.

Puede pegar las funciones o las variables de sistema utilizadas habitualmente


seleccionando un grupo de la lista Grupo de funciones y pulsando dos veces en la
funcin o variable de las listas de funciones y variables especiales (o seleccione la
funcin o variable y pulse en la flecha que se encuentra sobre la lista Grupo de
funciones). Rellene los parmetros indicados mediante interrogaciones (aplicable slo
a las funciones). El grupo de funciones con la etiqueta Todo contiene una lista de
todas las funciones y variables de sistema disponibles. En un rea reservada del
cuadro de dilogo se muestra una breve descripcin de la funcin o variable
actualmente seleccionada.

62

Prof. Willer David Chanduv Puicn

SPSS BSICO

Las constantes de cadena deben ir entre comillas o apstrofos.

Si los valores contienen decimales, debe utilizarse una coma(,) como indicador
decimal.

Para las nuevas variables de cadena, tambin debern seleccionar Tipo y etiqueta para
especificar el tipo de datos.

Calcular variable: Si los casos


El cuadro de dilogo Si los casos permite aplicar transformaciones de los datos para
subconjuntos de casos seleccionados utilizando expresiones condicionales. Una expresin
condicional devuelve un valor verdadero, falso o perdido para cada caso.
Figura 35. Cuadro de dilogo Calcular variable: Si los casos

Si el resultado de una expresin condicional es verdadero, se incluir el caso en el


subconjunto seleccionado.

Si el resultado de una expresin condicional es falso o perdido, no se incluir el caso


en el subconjunto seleccionado.

La mayora de las expresiones condicionales utilizan al menos uno de los seis


operadores de relacin (<, >, <=, >=, =, and ~=) de la calculadora.

63

Prof. Willer David Chanduv Puicn

SPSS BSICO

Las expresiones condicionales pueden incluir nombres de variable, constantes,


operadores aritmticos, funciones numricas (y de otros tipos), variables lgicas y
operadores de relacin.

Calcular variable: Tipo y etiqueta


Por defecto, las nuevas variables calculadas son numricas. Para calcular una nueva variable
de cadena, deber especificar el tipo de los datos y su ancho.
Etiqueta. Etiqueta de variable descriptiva y opcional de hasta 120 caracteres. Puede escribir
el texto de una etiqueta o bien utilizar los primeros 110 caracteres de la expresin de clculo.
Tipo. Las variables calculadas pueden ser numricas o de cadena (alfanumricas). Las
variables de cadena no se pueden utilizar en clculos aritmticos.
Figura 36. Cuadro de dilogo Tipo y etiqueta

Funciones
Se dispone de muchos tipos de funciones, entre ellos:

Funciones aritmticas.

Funciones estadsticas.

Funciones de cadena.

Funciones de fecha y hora.

Funciones de distribucin.

Funciones de variables aleatorias.

Funciones de valores perdidos.

Funciones de puntuacin (slo servidor de SPSS).

Si desea obtener ms informacin y una descripcin detallada de cada funcin, escriba


funciones en la pestaa ndice del sistema de ayuda.

64

Prof. Willer David Chanduv Puicn

SPSS BSICO
Valores perdidos en funciones
Las funciones y las expresiones aritmticas sencillas tratan los valores perdidos de diferentes
formas. En la expresin: (var1+var2+var3)/3
El resultado es el valor perdido si un caso tiene un valor perdido para cualquiera de las tres
variables. En la expresin: MEAN (var1, var2, var3) El resultado es el valor perdido slo si el
caso tiene valores perdidos para las tres variables.
En las funciones estadsticas se puede especificar el nmero mnimo de argumentos que
deben tener valores no perdidos. Para ello, escriba un punto y el nmero mnimo de
argumentos despus del nombre de la funcin, como en: MEAN.2 (var1, var2, var3)
Contar apariciones de valores dentro de los casos
Este cuadro de dilogo crea una variable que, para cada caso, cuenta las apariciones del
mismo valor, o valores, en una lista de variables. Por ejemplo, un estudio podr contener una
lista de revistas con las casillas de verificacin s/no para indicar qu revistas lee cada
persona encuestada. Se podra contar el nmero de respuestas s de cada encuestado para
crear una nueva variable que contenga el nmero total de revistas ledas.
Figura 37. Cuadro de dilogo Contar apariciones de valores dentro de los casos

65

Prof. Willer David Chanduv Puicn

SPSS BSICO
Para contar apariciones de valores dentro de los casos
Elija en los mens:
Transformar
Contar valores dentro de los casos...
Introduzca el nombre de la variable de destino.
Seleccione dos o ms variables del mismo tipo (numricas o de cadena).
Pulse en Definir valores y especifique los valores que se deben contar.
Si lo desea, puede definir un subconjunto de casos en los que contar las apariciones de
valores.
Contar valores dentro de los casos: Contar los valores
El valor de la variable de destino (en el cuadro de dilogo principal) se incrementa en 1 cada
vez que una de las variables seleccionadas coincide con una especificacin de la lista Contar
los valores. Si un caso coincide con varias de las especificaciones en cualquiera de las
variables, la variable de destino se incrementa varias veces para esa variable.
Las especificaciones de valores pueden incluir valores individuales, valores perdidos o
valores perdidos del sistema y rangos de valores. Los rangos incluyen sus puntos finales y los
valores definidos como perdidos por el usuario que estn dentro del rango.
Figura 38. Cuadro de dilogo contar los valores

66

Prof. Willer David Chanduv Puicn

SPSS BSICO
Contar apariciones: Si los casos
El cuadro de dilogo Si los casos permite contar apariciones de valores para un subconjunto
de casos seleccionado utilizando expresiones condicionales. Una expresin condicional
devuelve un valor verdadero, falso o perdido para cada caso.
Figura 39. Cuadro de dilogo Contar apariciones si los casos

Si desea conocer las consideraciones generales sobre el uso del cuadro de dilogo Si los
casos, consulte Calcular variable: Si los casos en p. 138.
Recodificacin de valores
Los valores de datos se pueden modificar mediante la recodificacin. Esto es particularmente
til para agrupar o combinar categoras. Puede recodificar los valores dentro de las variables
existentes o crear variables nuevas que se basen en los valores recodificados de las variables
existentes.
Recodificar en las mismas variables
El cuadro de dilogo Recodificar en las mismas variables le permite reasignar los valores de
las variables existentes o agrupar rangos de valores existentes en nuevos valores. Por
ejemplo, podra agrupar los salarios en categoras que sean rangos de salarios.

67

Prof. Willer David Chanduv Puicn

SPSS BSICO
Puede recodificar las variables numricas y de cadena. Si selecciona mltiples variables,
todas deben ser del mismo tipo. No se pueden recodificar juntas las variables numricas y de
cadena.
Figura 40. Cuadro de dilogo Recidificar en la misma variable

Para recodificar los valores de una variable


Elija en los mens:
Transformar
Recodificar en las mismas variables...
Seleccione las variables que desee recodificar. Si selecciona mltiples variables, todas
debern ser del mismo tipo (numricas o de cadena).
Pulse en Valores antiguos y nuevos y especifique cmo deben recodificarse los
valores.
Si lo desea, puede definir un subconjunto de los casos para su recodificacin. El cuadro de
dilogo Si los casos para esto es igual al que se describe para Contar apariciones.
Recodificar en las mismas variables: Valores antiguos y nuevos
Este cuadro de dilogo permite definir los valores que se van a recodificar. Todas las
especificaciones de valores deben pertenecer al mismo tipo de datos (numricos o de cadena)
que las variables seleccionadas en el cuadro de dilogo principal.

68

Prof. Willer David Chanduv Puicn

SPSS BSICO
Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar
valores individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos
del sistema no se pueden seleccionar para las variables de cadena, ya que ninguno de los
conceptos es aplicable a estas variables. Los rangos incluyen sus puntos finales y los valores
definidos como perdidos por el usuario que estn dentro del rango.

Valor (Recodificar). Valor antiguo individual que se a recodificar en un valor nuevo.


El tipo de datos (numrico o de cadena) del valor introducido debe coincidir con el
tipo de datos de las variables desee recodificar

Perdido por el sistema. Valores asignados por SPSS cuando los valores de sus datos
no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un
campo numrico est vaco, o cuando no est definido un valor como resultado de un
comando de transformacin. Los valores numricos perdidos del sistema se muestran
como puntos. Las variables de cadena no pueden tener valores perdidos del sistema,
ya que es lcito cualquier carcter en las variables de cadena.

Perdido por el sistema o por el usuario. Observaciones que tienen valores que, o
bien han sido declarados como perdidos por el usuario o bien son desconocidos y se
les ha asignado el valor perdido del sistema, lo cual se indica mediante un punto (.).

Rango (Rango inclusivo de valores). Un rango inclusivo de valores. No est


disponible para variables de cadena. Se incluirn cualesquiera valores definidos por el
usuario como perdidos que se encuentren dentro del rango.

Todos los dems valores. Cualquier valor no incluido en una de las especificaciones
de la lista Antiguo->Nuevo. Aparece en la lista Antiguo->Nuevo como ELSE (otros).

Valor nuevo. Es el valor individual en el que se recodifica cada valor o rango de valores
antiguo.
Puede introducir un valor o asignar el valor perdido del sistema.

Valor. Valor en el que se va a recodificar uno o ms valores antiguos. El tipo de datos


(numrico o de cadena) del valor introducido debe coincidir con el tipo de datos del
valor antiguo.

69

Prof. Willer David Chanduv Puicn

SPSS BSICO

Perdido por el sistema. Recodifica el valor antiguo especificado como valor perdido
por el sistema. El valor perdido por el sistema no se utiliza en los clculos. Adems,
los casos con valor perdido por el sistema se excluyen de muchos procedimientos. No
se encuentra disponible para las variables de cadena.

Antiguo>Nuevo. Contiene la lista de especificaciones que se va a utilizar para recodificar la


variable o las variables. Puede aadir, cambiar y borrar las especificaciones que desee. La
lista se ordena automticamente basndose en la especificacin del valor antiguo y siguiendo
este orden: valores nicos, valores perdidos, rangos y todos los dems valores. Si cambia una
especificacin de recodificacin en la lista, el procedimiento volver a ordenar la lista
automticamente, si fuera necesario, para mantener este orden.
Figura 41. Cuadro de dilogo Valores antiguos y nuevos

Recodificar en distintas variables


El cuadro de dilogo Recodificar en distintas variables le permite reasignar los valores de las
variables existentes o agrupar rangos de valores existentes en nuevos valores para una
variable nueva. Por ejemplo, podra agrupar los salarios en una nueva variable que contenga
categoras de rangos de salarios.

70

Prof. Willer David Chanduv Puicn

SPSS BSICO

Puede recodificar las variables numricas y de cadena.

Puede recodificar variables numricas en variables de cadena y viceversa.

Si selecciona mltiples variables, todas deben ser del mismo tipo. No se pueden
recodificar juntas las variables numricas y de cadena.

Figura 42. Cuadro de dilogo Recodificar en distintas variables

Para recodificar los valores de una variable en una nueva variable


Elija en los mens:
Transformar
Recodificar en distintas variables...
Seleccione las variables que desee recodificar. Si selecciona mltiples variables, todas
debern ser del mismo tipo (numricas o de cadena).
Introduzca el nombre de la nueva variable de resultado para cada nueva variable y
pulse en Cambiar.
Pulse en Valores antiguos y nuevos y especifique cmo deben recodificarse los
valores.

71

Prof. Willer David Chanduv Puicn

SPSS BSICO
Si lo desea, puede definir un subconjunto de los casos para su recodificacin. El cuadro de
dilogo Si los casos para esto es igual al que se describe para Contar apariciones.
Recodificar en distintas variables: Valores antiguos y nuevos
Este cuadro de dilogo permite definir los valores que se van a recodificar.
Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar
valores individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos
del sistema no se pueden seleccionar para las variables de cadena, ya que ninguno de los
conceptos es aplicable a estas variables. Los valores antiguos deben ser del mismo tipo de
datos (numricos o de cadena) que la variable original. Los rangos incluyen sus puntos
finales y los valores definidos como perdidos por el usuario que estn dentro del rango.

Valor (Recodificar). Valor antiguo individual que se a recodificar en un valor nuevo.


El tipo de datos (numrico o de cadena) del valor introducido debe coincidir con el
tipo de datos de las variables desee recodificar.

Perdido por el sistema. Valores asignados por SPSS cuando los valores de sus datos
no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un
campo numrico est vaco, o cuando no est definido un valor como resultado de un
comando de transformacin. Los valores numricos perdidos del sistema se muestran
como puntos. Las variables de cadena no pueden tener valores perdidos del sistema,
ya que es lcito cualquier carcter en las variables de cadena.

Perdido por el sistema o por el usuario. Observaciones que tienen valores que, o
bien han sido declarados como perdidos por el usuario o bien son desconocidos y se
les ha asignado el valor perdido del sistema, lo cual se indica mediante un punto (.).

Rango (Rango inclusivo de valores). Un rango inclusivo de valores. No est


disponible para variables de cadena. Se incluirn cualesquiera valores definidos por el
usuario como perdidos que se encuentren dentro del rango.

Todos los dems valores. Cualquier valor no incluido en una de las especificaciones
de la lista Antiguo->Nuevo. Aparece en la lista Antiguo->Nuevo como ELSE (otros).

72

Prof. Willer David Chanduv Puicn

SPSS BSICO
Valor nuevo. Es el valor individual en el que se recodifica cada valor o rango de valores
antiguo.
Los valores nuevos pueden ser numricos o de cadena.

Valor. Valor en el que se va a recodificar uno o ms valores antiguos. El tipo de datos


(numrico o de cadena) del valor introducido debe coincidir con el tipo de datos del
valor antiguo.

Perdido por el sistema. Recodifica el valor antiguo especificado como valor perdido
por el sistema. El valor perdido por el sistema no se utiliza en los clculos. Adems,
los casos con valor perdido por el sistema se excluyen de muchos procedimientos. No
se encuentra disponible para las variables de cadena.

Copiar los valores antiguos. Retiene el valor antiguo. Si algunos de los valores no
requieren la recodificacin, utilice esta opcin para incluir los valores antiguos.
Cualquier valor antiguo que no sea especificado no se incluye en la nueva variable, y
los casos con esos valores se asignan al valor perdido por el sistema en la nueva
variable.

Las variables de los resultados son cadenas. Define la nueva variable recodificada como
variable de cadena (alfanumrica). La variable antigua puede ser numrica o de cadena.
Convertir cadenas numricas en nmeros. Convierte los valores de cadena que contienen
nmeros en valores numricos. A las cadenas que contengan cualquier cosa que no sean
nmeros y un carcter de signo opcional (+ -) se les asignar el valor perdido por el
sistema.
Antiguo>Nuevo. Contiene la lista de especificaciones que se va a utilizar para recodificar la
variable o las variables. Puede aadir, cambiar y borrar las especificaciones que desee. La
lista se ordena automticamente basndose en la especificacin del valor antiguo y siguiendo
este orden: valores nicos, valores perdidos, rangos y todos los dems valores. Si cambia una
especificacin de recodificacin en la lista, el procedimiento volver a ordenar la lista
automticamente, si fuera necesario, para mantener este orden.

73

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 43. Cuadro de dilogo Valores antiguos y nuevos

Recodificacin automtica
El cuadro de dilogo Recodificacin automtica le permite convertir los valores numricos y
de cadena en valores enteros consecutivos. Si los cdigos de la categora no son secuenciales,
las casillas vacas resultantes reducen el rendimiento e incrementan los requisitos de memoria
de muchos procedimientos. Adems, algunos procedimientos no pueden utilizar variables de
cadena y otros requieren valores enteros consecutivos para los niveles de los factores.
Figura 44. Cuadro de dilogo Recodificacin automtica.

74

Prof. Willer David Chanduv Puicn

SPSS BSICO

La nueva variable, o variables, creadas por la recodificacin automtica conservan


todas las etiquetas de variable y de valor definidas de la variable antigua. Para los
valores que no tienen una etiqueta de valor ya definida se utiliza el valor original
como etiqueta del valor recodificado. Una tabla muestra los valores antiguos, los
nuevos y las etiquetas de valor.

Los valores de cadena se recodifican por orden alfabtico, con las maysculas antes
que las minsculas.

Los valores perdidos se recodifican como valores perdidos mayores que cualquier
valor no perdido y conservando el orden. Por ejemplo, si la variable original posee 10
valores no perdidos, el valor perdido mnimo se recodificar como 11, y el valor 11
ser un valor perdido para la nueva variable.

Usar el mismo esquema de recodificacin para todas las variables. Esta opcin le permite
aplicar un nico esquema de recodificacin para todas las variables seleccionadas, lo que
genera un esquema de codificacin coherente para todas las variables nuevas.
Si selecciona esta opcin, se aplican las siguientes reglas y limitaciones:

Todas las variables deben ser del mismo tipo (numricas o de cadena).

Todos los valores observados para todas las variables seleccionadas se utilizan para
crear un orden de valores para recodificar en enteros consecutivos.

Los valores perdidos definidos por el usuario para las variables nuevas se basan en la
primera variable de la lista con valores perdidos definidos por el usuario. El resto de
los valores de las dems variables originales, excepto los valores perdidos del sistema,
se consideran vlidos.

Trate los valores de cadena en blanco como valores perdidos definidos por el usuario.
En el caso de las variables de cadena, los valores en blanco o nulos no son tratados como
valores perdidos del sistema. Esta opcin recodifica automticamente las cadenas en blanco
en un valor perdido definido por el usuario mayor que el valor no perdido mximo.

75

Prof. Willer David Chanduv Puicn

SPSS BSICO

GESTIN Y TRANSFORMACIN DE LOS ARCHIVOS


Los archivos de datos no siempre estn organizados de la forma ideal para las necesidades
especficas del usuario. Puede que le interese combinar archivos de datos, organizar los datos
en un orden diferente, seleccionar un subconjunto de casos o cambiar la unidad de anlisis
agrupando casos. Entre la amplia gama de posibilidades de transformacin de archivos
disponibles se encuentran las siguientes:
Ordenar datos. Puede ordenar los casos en funcin del valor de una o ms variables.
Transponer casos y variables. El formato de archivo de datos de SPSS lee las filas como
casos y las columnas como variables. Para los archivos de datos en los que el orden est
invertido, se pueden intercambiar las filas y las columnas para leer los datos en el formato
correcto.
Fundir archivos. Puede fundir dos o ms archivos de datos. Es posible combinar archivos
con las mismas variables pero con casos distintos, o con los mismos casos pero variables
diferentes.
Seleccionar subconjuntos de casos. Puede restringir el anlisis a un subconjunto de casos o
efectuar anlisis simultneos de subconjuntos diferentes.
Agregar datos. Puede cambiar la unidad de anlisis agregando casos basados en el valor de
una o ms variables de agrupacin.
Ponderar datos. Puede ponderar los casos para un anlisis basado en el valor de una variable
de ponderacin.
Reestructurar datos. Puede reestructurar los datos para crear un nico caso (registro) a
partir de varios casos o crear varios casos a partir de un nico caso.
Ordenar casos
Este cuadro de dilogo ordena los casos (las filas) del archivo de datos basndose en los
valores de una o ms variables de ordenacin. Puede ordenar los casos en orden ascendente o
descendente.

Si selecciona ms de una variable de ordenacin, los casos se ordenarn por variable


dentro de las categoras de la variable anterior de la lista Ordenar por. Por ejemplo, si
selecciona Sexo como la primera variable de ordenacin y Minora como la segunda,
los casos se ordenarn por minoras dentro de cada categora de sexo.

76

Prof. Willer David Chanduv Puicn

SPSS BSICO

La secuencia de ordenacin est basada en el orden definido de forma regional (y no


tiene por qu ser igual al orden numrico de los cdigos de caracteres). La
configuracin regional por defecto es la configuracin regional del sistema operativo.
Puede controlar la configuracin regional con el ajuste Idioma de la pestaa General
del cuadro de dilogo Opciones (men Edicin).

Figura 45. Cuadro de dilogo Ordenar casos

Para ordenar casos


Elija en los mens:
Datos
Ordenar casos...
Seleccione una o ms variables de ordenacin.
Transponer
Transponer crea un archivo de datos nuevo en el que se transponen las filas y las columnas
del archivo de datos original de manera que los casos (las filas) se convierten en variables, y
las variables (las columnas) se convierten en casos. Tambin crea automticamente nombres
de variable y presenta una lista de dichos nombres.

Se crea automticamente una nueva variable de cadena, case_lbl, que contiene el


nombre de variable original.

77

Prof. Willer David Chanduv Puicn

SPSS BSICO

Si el conjunto de datos activo contiene una variable de identificacin o de nombre con


valores nicos, podr utilizarla como variable de nombre: sus valores se emplearn
como nombres de variable en el archivo de datos transpuesto. Si se trata de una
variable numrica, los nombres de variable comenzarn por la letra V, seguida de un
valor numrico.

Los valores perdidos definidos por el usuario se convierten en el valor perdido del
sistema en el archivo de datos transpuesto. Para conservar cualquiera de estos valores,
se debe cambiar la definicin de los valores perdidos en la Vista de variables del
Editor de datos.

Para transponer variables y casos


Elija en los mens:
Datos
Transponer...
Seleccione la variable o variables que desee transponer en casos.
Fusin de archivos de datos
Es posible unir los datos de dos archivos de dos maneras diferentes. Tiene la posibilidad de:

Fundir el conjunto de datos activo con otro conjunto de datos abierto o archivo de
datos con formato SPSS que contenga las mismas variables pero diferentes casos.

Fundir el conjunto de datos activo con otro conjunto de datos abierto o archivo de
datos con formato SPSS que contenga los mismos casos pero diferentes variables.

Para fundir archivos


Elija en los mens:
Datos
Fundir archivos
Seleccione Aadir casos o Aadir variables.

78

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 46. Seleccin de archivos para fundir

Aadir casos
Aadir casos fusiona el conjunto de datos activo con un segundo conjunto de datos o un
archivo de datos con formato SPSS que contenga las mismas variables (columnas) pero
diferentes casos (filas). Por ejemplo, podra registrar la misma informacin de los clientes de
dos zonas de venta diferentes y conservar los datos de cada zona en archivos distintos. El
segundo conjunto de datos puede ser un archivo de datos con formato SPSS externo o un
conjunto de datos disponible en la sesin actual.
Figura 47. Cuadro de dilogo Aadir casos

79

Prof. Willer David Chanduv Puicn

SPSS BSICO
Variables desemparejadas. Muestra las variables que se van a excluir del nuevo archivo de
datos fusionado. Las variables del conjunto de datos activo se identifican mediante un
asterisco (*).
Las variables del otro conjunto de datos se identifican con un signo ms (+). Por defecto, la
lista contiene:

Las variables de cualquiera de los archivos de datos que no coincidan con un nombre
de variable del otro archivo. Puede crear pares a partir de variables desemparejadas e
incluirlos en el nuevo archivo fusionado.

Las variables definidas como datos numricos en un archivo y como datos de cadena
en el otro. Las variables numricas no pueden fusionarse con variables de cadena.

Variables de cadena de longitud diferente. El ancho definido de una variable de


cadena debe ser el mismo en ambos archivos de datos.

Variables del nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo
archivo de datos fusionado. Por defecto, la lista incluye todas las variables que coinciden en
el nombre y el tipo de datos (numricos o de cadena).

Puede eliminar de la lista las variables que no desee incluir en el archivo fusionado.

Las variables desemparejadas incluidas en el archivo fusionado contendrn los datos


perdidos para los casos del archivo que no contiene esa variable.

Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de
origen. Esta variable toma un valor 0 para los casos del archivo de datos de trabajo y un valor
1 para los casos del archivo de datos externo.
Para fundir archivos de datos con las mismas variables y casos diferentes
Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios
conjuntos de datos abiertos, convierta uno de los conjuntos de datos que desea
fusionar en el conjunto de datos activo. Los casos de este archivo aparecern
primero en el nuevo archivo de datos fusionado.
Elija en los mens:
Datos
Fundir archivos
Aadir casos...

80

Prof. Willer David Chanduv Puicn

SPSS BSICO
Seleccione el conjunto de datos o el archivo de datos con formato SPSS que va a
fusionar con el conjunto de datos activo.
Elimine de la lista Variables del nuevo conjunto de datos activo cualquier variable
que no desee incluir.
Aada parejas de variables de la lista Variables desemparejadas que representen la
misma informacin registrada con nombres diferentes en los dos archivos. Por
ejemplo, la fecha de nacimiento podra tener el nombre de variable fechnac en un
archivo y nacfech en el otro.
Para seleccionar una pareja de variables desemparejadas
Pulse en una de las variables en la lista Variables desemparejadas.
Mantenga pulsada la tecla Ctrl mientras selecciona la otra variable de la lista con el
ratn (pulse al mismo tiempo la tecla Ctrl y el botn izquierdo del ratn).
Pulse en Casar para desplazar el par de variables a la lista Variables del nuevo
conjunto de datos activo. (El nombre de variable del conjunto de datos activo se
emplear como el nombre de variable en el archivo fusionado.)
Figura 48. Seleccin de parejas de variables mediante la tecla control

81

Prof. Willer David Chanduv Puicn

SPSS BSICO

Aadir casos: Cambiar nombre


Puede cambiar los nombres de las variables del conjunto de datos activo o de otro conjunto
de datos antes de desplazarlas desde la lista de variables desemparejadas a la lista de
variables que se van a incluir en el archivo de datos fusionado. Cambiar el nombre de las
variables le permite:

Utilizar el nombre de variable del otro conjunto de datos en lugar del nombre del
conjunto de datos activo para las parejas de variables.

Incluir dos variables con el mismo nombre pero de diferentes tipos o longitudes de
cadena.

Por ejemplo, para incluir la variable numrica sexo del conjunto de datos activo y la variable
de cadena sexo del otro conjunto de datos, primero se debe cambiar el nombre de una de
ellas.
Fusin de ms de dos orgenes de datos
Puede fusionar hasta 50 conjuntos de datos y/o archivos de datos con la sintaxis de
comandos.
Si desea obtener informacin, consulte el comando ADD FILES en la referencia de sintaxis
de comandos de SPSS (SPSS Command Syntax Reference) (disponible en el men Ayuda).
Aadir variables
Aadir variables fusiona el conjunto de datos activo con otro conjunto de datos abierto o un
archivo de datos con formato SPSS que contenga los mismos casos (filas) pero diferentes
variables (columnas). Por ejemplo, es posible que desee fusionar un archivo de datos que
contenga los resultados previos de la prueba con otro que contenga los resultados posteriores.

Los casos deben estar ordenados de la misma manera en ambos conjuntos de datos.

Si se utilizan una o ms variables clave para emparejar los casos, los dos conjuntos de
datos deben estar ordenados por orden ascendente de la variable o variables clave.

Los nombres de las variables del segundo archivo de datos que son duplicados de los
del conjunto de datos activo se excluyen por defecto, ya que Aadir variables supone
que estas variables contienen informacin duplicada.

82

Prof. Willer David Chanduv Puicn

SPSS BSICO
Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de
origen. Esta variable toma un valor 0 para los casos del archivo de datos de trabajo y un valor
1 para los casos del archivo de datos externo.
Figura 49. Cuadro de dilogo Aadir variables

Variables excluidas. Muestra las variables que se van a excluir del nuevo archivo de datos
fusionado. Por defecto, la lista contiene los nombres de variable de otro conjunto de datos
que son duplicados de los del conjunto de datos. Las variables del conjunto de datos activo se
identifican mediante un asterisco (*). Las variables del otro conjunto de datos se identifican
con un signo ms (+). Si desea incluir en el archivo fusionado una variable excluida con un
nombre duplicado, cmbiele el nombre y adala a la lista de variables que se van a incluir.
Nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo conjunto de
datos fusionado. Por defecto, se incluyen en la lista todos los nombres de variable nicos que
existan en ambos conjuntos de datos.

83

Prof. Willer David Chanduv Puicn

SPSS BSICO
Variables clave. Si algunos casos de un conjunto de datos no se emparejan con los del otro
conjunto de datos (es decir, si faltan casos en un conjunto de datos), utilice las variables clave
para identificar y emparejar correctamente los casos de ambos conjuntos de datos. Tambin
puede utilizar las variables clave segn tablas de claves.

Las variables clave deben tener los mismos nombres en ambos conjuntos de datos.

Ambos conjuntos de datos deben estar ordenados segn el orden ascendente de las
variables clave, y el orden de las variables de la lista Variables clave debe ser igual a
su secuencia de ordenacin.

Los casos que no se emparejan con las variables clave se incluyen en el archivo
fusionado, pero no se funden con los casos del otro archivo. Los casos no
emparejados slo contienen valores para las variables del archivo de procedencia; las
variables del otro archivo contienen el valor perdido del sistema.

El que no es conjunto de datos activo (o el conjunto de datos activo) es una tabla de


claves. Una tabla de claves, o tabla de referencia, es un archivo en el que los datos de cada
caso se pueden aplicar a varios casos del otro archivo de datos. Por ejemplo, si un archivo
contiene informacin sobre los diferentes miembros de la familia (como el sexo, la edad, la
formacin) y el otro se puede utilizar el archivo global como una tabla de referencia y aplicar
los datos comunes de la familia a cada uno de sus miembros en el archivo fusionado.
Para fundir archivos con los mismos casos pero variables diferentes
Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios
conjuntos de datos abiertos, convierta uno de los conjuntos de datos que desea
fusionar en el conjunto de datos activo.
Elija en los mens:
Datos
Fundir archivos
Aadir variables...
Seleccione el conjunto de datos o el archivo de datos con formato SPSS que va a
fusionar con el conjunto de datos activo.

84

Prof. Willer David Chanduv Puicn

SPSS BSICO
Para seleccionar variables clave
Seleccione las variables entre las variables del archivo externo (marcadas con el signo
+) en la lista Variables excluidas.
Seleccione Emparejar los casos en las variables clave para los archivos ordenados.
Aada las variables a la lista Variables clave.
Las variables clave deben existir en el conjunto de datos activo y en el otro conjunto de datos.
Ambos conjuntos de datos deben estar ordenados segn el orden ascendente de las variables
clave, y el orden de las variables de la lista Variables clave debe ser igual a su secuencia de
ordenacin.
Aadir variables: Cambiar nombre
Puede cambiar los nombres de las variables del conjunto de datos activo o de otro conjunto
de datos antes de desplazarlas a la lista de variables que se van a incluir en el archivo de datos
fusionado. Esta medida es especialmente til cuando se desea incluir dos variables que tienen
el mismo nombre pero informacin diferente en los dos archivos.
Agregar datos
Agregar datos agrega grupos de casos en el conjunto de datos activo en casos individuales y
crea un archivo nuevo agregado o variables nuevas en el conjunto de datos activo que
contiene los datos agregados. Los casos se agregan en funcin del valor de una o ms
variables de segmentacin (agrupacin).

Si crea un archivo de datos agregado nuevo, dicho archivo de datos nuevo contiene un
caso para cada grupo definido por las variables de segmentacin. Por ejemplo, si hay
una variable de segmentacin con dos valores, el archivo de datos nuevo contiene slo
dos casos.

Si aade variables agregadas al conjunto de datos activo, no se agrega el archivo de


datos. Cada caso con los mismos valores de variables de segmentacin recibe los
mismos valores para las nuevas variables agregadas. Por ejemplo, si sexo es la nica
variable de segmentacin, todos los hombres reciben el mismo valor para la variable
agregada nueva que representa la edad media.

85

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 50. Cuadro de dilogo Agregar datos

Variables de segmentacin. Los casos se agrupan en funcin de los valores de las variables
de segmentacin. Cada combinacin nica de valores de variables de segmentacin define un
grupo.
Al crear un archivo de datos agregados nuevo, todas las variables de segmentacin se
guardan en el archivo nuevo con sus nombres y la informacin del diccionario. La variable de
segmentacin puede ser tanto numrica como de cadena.
Variables agregadas. Las variables de origen se utilizan con funciones agregadas para crear
variables agregadas nuevas. El nombre de la variable agregada viene seguido de una etiqueta
de variable opcional entrecomillada, el nombre de la funcin de agregacin y el nombre de la
variable de origen entre parntesis. Para las funciones de agregacin, las variables de origen
deben ser numricas.

86

Prof. Willer David Chanduv Puicn

SPSS BSICO
Puede anular los nombres por defecto de las variables agregadas con nuevos nombres de
variable, proporcionar etiquetas de variable descriptivas y cambiar las funciones empleadas
para calcular los valores de los datos agregados. Tambin puede crear una variable que
contenga el nmero de casos en cada grupo de segmentacin.
Para agregar un archivo de datos
Elija en los mens:
Datos
Agregar...
Seleccione una o ms variables de segmentacin que definan cmo deben agruparse
los casos para crear datos agregados.
Seleccione una o varias variables para incluir.
Seleccione una funcin de agregacin para cada variable agregada.

Segmentar archivo
Segmentar archivo divide el archivo de datos en distintos grupos para el anlisis basndose en
los valores de una o ms variables de agrupacin. Si selecciona varias variables de
agrupacin, los casos se agruparn por variable dentro de las categoras de la variable anterior
de la lista Grupos basados en. Por ejemplo, si selecciona sexo como la primera variable de
agrupacin y minora como la segunda, los casos se agruparn por minoras dentro de cada
categora de sexo.

Es posible especificar hasta ocho variables de agrupacin.

Cada ocho caracteres de una variable de cadena larga (variables de cadena que
superan los ocho caracteres) cuenta como una variable hasta llegar al lmite de ocho
variables de agrupacin.

Los casos deben ordenarse segn los valores de las variables de agrupacin, en el
mismo orden en el que aparecen las variables en la lista Grupos basados en. Si el
archivo de datos todava no est ordenado, seleccione Ordenar archivo segn
variables de agrupacin.

87

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 51. Cuadro de dilogo Segmentar archivo

Comparar los grupos. Los grupos de segmentacin del archivo se presentan juntos para
poder compararlos. Para las tablas pivote se crea una sola tabla y cada variable de
segmentacin del archivo puede desplazarse entre las dimensiones de la tabla. En el caso de
los grficos se crea un grfico diferente para cada grupo y se muestran juntos en el Visor.
Organizar los resultados por grupos. Los resultados de cada procedimiento se muestran
por separado para cada grupo de segmentacin del archivo.
Para segmentar un archivo de datos para el anlisis
Elija en los mens:
Datos
Segmentar archivo...
Seleccione Comparar los grupos u Organizar los resultados por grupos.
Seleccione una o ms variables de agrupacin.
Seleccionar casos
Seleccionar casos proporciona varios mtodos para seleccionar un subgrupo de casos
basndose en criterios que incluyen variables y expresiones complejas. Tambin se puede
seleccionar una muestra aleatoria de casos. Los criterios usados para definir un subgrupo
pueden incluir:

88

Prof. Willer David Chanduv Puicn

SPSS BSICO

Valores y rangos de las variables

Rangos de fechas y horas

Nmeros de caso (filas)

Expresiones aritmticas

Expresiones lgicas

Funciones

Figura 52. Cuadro de dilogo Seleccionar casos

Todos los casos. Desactiva el filtrado y utiliza todos los casos.


Si se satisface la condicin. Utiliza una expresin condicional para seleccionar los casos. Si
el resultado de la expresin condicional es verdadero, el caso se selecciona. Si el resultado es
falso o perdido, entonces el caso no se selecciona.
Muestra aleatoria de casos. Selecciona una muestra aleatoria basndose en un porcentaje
aproximado o en un nmero exacto de casos.
Basndose en el rango del tiempo o de los casos. Selecciona los casos basndose en un
rango de los nmeros de caso o en un rango de las fechas/horas.

89

Prof. Willer David Chanduv Puicn

SPSS BSICO
Usar variable de filtro. Utiliza como variable para el filtrado la variable numrica
seleccionada del archivo de datos. Se seleccionan los casos con cualquier valor distinto del 0
o del valor perdido para la variable seleccionada.
Resultados
Esta seccin controla el tratamiento de casos no seleccionados. Puede elegir una de las
siguientes alternativas para tratar los casos no seleccionados:

Descartar casos no seleccionados. Los casos no seleccionados no se incluyen en el


anlisis, pero se conservan en el conjunto de datos. Podr utilizar los casos no
seleccionados ms adelante en la sesin, si desactiva el filtrado. Si selecciona una
muestra aleatoria o si selecciona los casos mediante una expresin condicional, se
generar una variable con el nombre filter_$ que tendr el valor 1 para los casos
seleccionados y el valor 0 para los casos no seleccionados.

Copiar casos seleccionados a un nuevo conjunto de datos. Los casos seleccionados


se copiarn a un nuevo conjunto de datos, lo que mantendr inalterado el conjunto de
datos original. Los casos no seleccionados no se incluirn en el nuevo conjunto de
datos y se mantendrn en su estado original en el conjunto de datos original.

Eliminar casos no seleccionados. Los casos no seleccionados se eliminarn del


conjunto de datos. Slo se pueden recuperar los casos eliminados saliendo del archivo
sin guardar ningn cambio y abrindolo de nuevo. La eliminacin de los casos ser
permanente si se guardan los cambios en el archivo de datos. Nota: Si elimina los
casos no seleccionados y guarda el archivo, no ser posible recuperar estos casos.

Para seleccionar un subconjunto de casos


Elija en los mens:
Datos
Seleccionar casos...
Seleccione uno de los mtodos de seleccin de casos.
Especifique los criterios para la seleccin de casos.
Seleccionar casos: Si la opcin
Este cuadro de dilogo permite seleccionar subconjuntos de casos utilizando expresiones
condicionales. Una expresin condicional devuelve un valor verdadero, falso o perdido para
cada caso.

90

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 53. Cuadro de dilogo Seleccionar casos: Si

Si el resultado de una expresin condicional es verdadero, se incluir el caso en el


subconjunto seleccionado.

Si el resultado de una expresin condicional es falso o perdido, no se incluir el caso


en el subconjunto seleccionado.

La mayora de las expresiones condicionales utilizan al menos uno de los seis


operadores de relacin (<, >, <=, >=, =, and ~=) de la calculadora.

Las expresiones condicionales pueden incluir nombres de variable, constantes,


operadores aritmticos, funciones numricas (y de otros tipos), variables lgicas y
operadores de relacin.

Seleccionar casos: Muestra aleatoria


Este cuadro de dilogo permite seleccionar una muestra aleatoria basada en un porcentaje
aproximado o en un nmero exacto de casos. El muestreo se realiza sin sustitucin, de
manera que el mismo caso no se puede seleccionar ms de una vez.

91

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 54. Cuadro de dilogo seleccionar casos: Muestra aleatoria

Dado que esta rutina toma una decisin pseudo-aleatoria para cada caso, el porcentaje de
casos seleccionados slo se puede aproximar al especificado. Cuantos ms casos contenga el
archivo de datos, ms se acercar el porcentaje de casos seleccionados al porcentaje
especificado.
Exactamente. Un nmero de casos especificado por el usuario. Tambin se debe especificar
el nmero de casos a partir de los cuales se generar la muestra. Este segundo nmero debe
ser menor o igual que el nmero total de casos presentes en el archivo de datos. Si lo excede,
la muestra contendr un nmero menor de casos proporcional al nmero solicitado.
Seleccionar casos: Amplitud
Este cuadro de dilogo selecciona los casos basndose en un rango de nmeros de caso o en
un rango de fechas u horas.

Los rangos de casos se basan en el nmero de fila que se muestra en el Editor de


datos.

Los rangos de fechas y horas slo estn disponibles para los datos de serie temporal
con variables de fecha definidas (men Datos, Definir fechas).

92

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 55.

Cuadro de dilogo Seleccionar casos: Rango para rangos de casos (sin

variables de fecha definidas

Figura 56. Cuadro de dilogo Seleccionar casos: Rango para datos de la serie temporal
con variables de fecha definidas

Ponderar casos
Ponderar casos proporciona a los casos diferentes ponderaciones (mediante una rplica
simulada) para el anlisis estadstico.

Los valores de la variable de ponderacin deben indicar el nmero de observaciones


representadas por casos nicos en el archivo de datos.

Los casos con valores perdidos, negativos o cero para la variable de ponderacin se
excluyen del anlisis.

Los valores fraccionarios son vlidos; se usan exactamente donde adquieren sentido y,
con mayor probabilidad, donde se tabulan los casos.

93

Prof. Willer David Chanduv Puicn

SPSS BSICO
Figura 57. Cuadro de dilogo Ponderar Casos

Si aplica una variable de ponderacin, sta seguir vigente hasta que se seleccione otra o se
desactive la ponderacin. Si guarda un archivo de datos ponderado, la informacin de
ponderacin se guardar con el archivo. Puede desactivar la ponderacin en cualquier
momento, incluso despus de haber guardado el archivo de forma ponderada.
Ponderaciones en las tablas de contingencia. El procedimiento Tablas de contingencia
cuenta con diversas opciones para el tratamiento de ponderaciones de los casos.
Ponderaciones en los diagramas de dispersin y los histogramas. Los diagramas de
dispersin y los histogramas tienen una opcin para activar y desactivar las ponderaciones de
los casos, pero dicha opcin no afecta a los casos que tienen un valor negativo, un valor 0 o
un valor perdido para la variable de ponderacin. Estos casos permanecen excluidos del
grfico incluso si se desactiva la ponderacin desde el grfico.
Para ponderar casos
Elija en los mens:
Datos
Ponderar casos...
Seleccione Ponderar casos mediante.
Seleccione una variable de frecuencia.
Los valores de la variable de frecuencia se utilizan como ponderaciones de los casos. Por
ejemplo, un caso con un valor 3 para la variable de frecuencia representar tres casos en el
archivo de datos ponderado.

94

Prof. Willer David Chanduv Puicn

SPSS BSICO

FRECUENCIAS
El procedimiento Frecuencias proporciona estadsticos y representaciones grficas que
resultan tiles para describir muchos tipos de variables. El procedimiento Frecuencias es un
comienzo para empezar a consultar los datos.
Para los informes de frecuencias y los grficos de barras, puede organizar los diferentes
valores en orden ascendente o descendente u ordenar las categoras por sus frecuencias. Es
posible suprimir el informe de frecuencias cuando una variable posee muchos valores
diferentes. Puede etiquetar los grficos con las frecuencias (la opcin por defecto) o con los
porcentajes.
Ejemplo. Cul es la distribucin de los clientes de una empresa por tipo de industria? En los
resultados podra observar que el 37,5% de sus clientes pertenece a agencias
gubernamentales, el 24,9% a corporaciones, el 28,1% a instituciones acadmicas, y el 9,4% a
la industria sanitaria. Con respecto a los datos continuos, cuantitativos, como los ingresos por
ventas, podra comprobar que el promedio de ventas de productos es de 3.576 dlares con
una desviacin tpica de 1.078 dlares.
Estadsticos y grficos. Frecuencias, porcentajes, porcentajes acumulados, media, mediana,
moda, suma, desviacin tpica, varianza, amplitud, valores mnimo y mximo, error tpico de
la media, asimetra y curtosis (ambos con sus errores tpicos), cuartiles, percentiles
especificados por el usuario, grficos de barras, grficos de sectores e histogramas.
Datos. Utilice cdigos numricos o cadenas cortas para codificar las variables categricas
(medidas de nivel nominal u ordinal).

95

Prof. Willer David Chanduv Puicn

SPSS BSICO
Supuestos. Las tabulaciones y los porcentajes proporcionan una descripcin til para los
datos de cualquier distribucin, especialmente para las variables con categoras ordenadas o
desordenadas.
Muchos de los estadsticos de resumen optativos, tales como la media y la desviacin tpica,
se basan en la teora normal y son apropiados para las variables cuantitativas con
distribuciones simtricas. Los estadsticos robustos, tales como la mediana, los cuartiles y los
percentiles son apropiados para las variables cuantitativas que pueden o no cumplir el
supuesto de normalidad.
Figura 58. Resultados de frecuencias

96

Prof. Willer David Chanduv Puicn

SPSS BSICO
Para obtener tablas de frecuencias
Elija en los mens:
Analizar
Estadsticos descriptivos
Frecuencias...
Figura 59. Cuadro de dilogo Frecuencias

Seleccione una o ms variables categricas o cuantitativas.


Si lo desea, puede:

Pulsar en Estadsticos para obtener estadsticos descriptivos para las variables


cuantitativas.

Pulsar en Grficos para obtener grficos de barras, grficos de sectores e histogramas.

Pulsar en Formato para determinar el orden en el que se muestran los resultados.

97

Prof. Willer David Chanduv Puicn

SPSS BSICO
Frecuencias: Estadsticos
Figura 60. Cuadro de dilogo Frecuencias: Estadsticos

Valores percentiles. Los valores de una variable cuantitativa que dividen los datos
ordenados en grupos, de forma que un porcentaje de los casos se encuentre por encima y otro
porcentaje se encuentre por debajo. Los cuartiles (los percentiles 25, 50 y 75) dividen las
observaciones en cuatro grupos de igual tamao. Si desea un nmero igual de grupos que no
sea cuatro, seleccione
Puntos de corte para n grupos iguales. Tambin puede especificar percentiles individuales
(por ejemplo, el percentil 95, el valor por debajo del cual se encuentran el 95% de las
observaciones).
Tendencia central. Los estadsticos que describen la localizacin de la distribucin,
incluyen:
Media, Mediana, Moda y Suma de todos los valores.

Media. Una medida de tendencia central. El promedio aritmtico; la suma dividida


por el nmero de casos.

98

Prof. Willer David Chanduv Puicn

SPSS BSICO

Mediana. Valor por encima y por debajo del cual se encuentran la mitad de los casos;
el percentil 50. Cuando el nmero de observaciones es par, la mediana es el promedio
de las dos observaciones centrales, una vez que han sido ordenadas de manera
ascendente o descendente. La mediana es una medida de tendencia central que no es
sensible a los valores atpicos (a diferencia de la media, que puede resultar afectada
por unos pocos valores extremadamente altos o bajos).

Moda. El valor que ocurre con mayor frecuencia. Si varios valores comparten la
mayor frecuencia de aparicin, cada una de ellas es una moda. El procedimiento de
frecuencias devuelve slo la ms pequea de esas modas mltiples.

Suma. La suma o total de todos los valores, a lo largo de todos los casos que no
tengan valores perdidos.

Dispersin. Los estadsticos que miden la cantidad de variacin o de dispersin en los datos,
incluyen: Desviacin tpica, Varianza, Rango, Mnimo, Mximo y Error tpico de la media.

Desviacin tpica. Medida de dispersin en torno a la media. En una distribucin


normal, el 68% de los casos se encuentra dentro de una desviacin tpica respecto a la
media y el 95% de los casos se encuentra dentro de dos desviaciones tpicas respecto
a la media. Por ejemplo, si la media de edad es 45, con una desviacin tpica de 10, el
95% de los casos estara entre 25 y 65 en una distribucin normal.

Varianza. Medida de dispersin en torno a la media, igual a la suma de los cuadrados


de las desviaciones respecto a la media dividida por el nmero de casos menos 1. La
varianza se mide en unas unidades que son el cuadrado de las de la propia variable.

Amplitud. Diferencia entre los valores mayor y menor de una variable numrica; el
mximo menos el mnimo. Tambin se denomina el recorrido de la variable.

Mnimo. Valor ms pequeo de una variable numrica.

Mximo. El mayor valor de una variable numrica.

E. T. media. Medida de cunto puede variar el valor de la media de una muestra a


otra, extradas stas de la misma distribucin. Puede utilizarse para comparar de
forma aproximada la media observada con un valor hipotetizado (es decir, podremos
concluir que dos valores son distintos si la razn de la diferencia respecto al error
tpico es menor que -2 o mayor que +2).

99

Prof. Willer David Chanduv Puicn

SPSS BSICO
Distribucin. Asimetra y curtosis son estadsticos que describen la forma y la simetra de la
distribucin. Estos estadsticos se muestran con sus errores tpicos.

Asimetra. Medida de la asimetra de una distribucin. La distribucin normal es


simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una
asimetra positiva significativa tiene una cola derecha larga. Una distribucin que
tenga una asimetra negativa mayor que el doble de su error tpico se asume que
indica una desviacin de la simetra.

Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al
punto central. Para una distribucin normal, el valor del estadstico de curtosis es 0.
Una curtosis positiva indica que las observaciones se concentran ms y presentan
colas ms largas que las de una distribucin normal. Una curtosis negativa indica que
las observaciones se agrupan menos y presentan colas ms cortas.

Los valores son puntos medios de grupos. Si los valores de los datos son puntos medios de
grupos (por ejemplo, si las edades de todas las personas entre treinta y cuarenta aos se
codifican como 35), seleccione esta opcin para estimar la mediana y los percentiles para los
datos originales no agrupados.
Frecuencias Grficos
Figura 61. Cuadro de dilogo Frecuencias: Grficos

100

Prof. Willer David Chanduv Puicn

SPSS BSICO

Tipo de grfico. Los grficos de sectores muestran la contribucin de las partes a un todo.
Cada sector de un grfico de este tipo corresponde a un grupo, definido por una nica
variable de agrupacin. Los grficos de barras muestran la frecuencia de cada valor o
categora distinta como una barra diferente, permitiendo comparar las categoras de forma
visual. Los histogramas tambin cuentan con barras, pero se representan a lo largo de una
escala de intervalos iguales. La altura de cada barra es el recuento de los valores que estn
dentro del intervalo para una variable cuantitativa. Los histogramas muestran la forma, el
centro y la dispersin de la distribucin.
Una curva normal superpuesta en un histograma ayuda a juzgar si los datos estn
normalmente distribuidos.
Valores del grfico. Para los grficos de barras, puede etiquetar el eje de escala con las
frecuencias o los porcentajes.
Frecuencias: Formato
Figura 62. Cuadro de dilogo Frecuencias: Formato

Ordenar por. La tabla de frecuencias se puede organizar respecto a los valores actuales de
los datos o respecto al recuento (frecuencia de aparicin) de esos valores y la tabla puede
organizarse en orden ascendente o descendente. Sin embargo, si solicita un histograma o
percentiles, Frecuencias asumir que la variable es cuantitativa y mostrar sus valores en
orden ascendente.

101

Prof. Willer David Chanduv Puicn

SPSS BSICO
Mltiples variables. Si desea generar tablas de estadsticos para mltiples variables, podr
mostrar todas las variables en una sola tabla (Comparar variables), o bien mostrar una tabla
de estadsticos independiente para cada variable (Organizar resultados segn variables).
Suprimir tablas con ms de n categoras. Esta opcin impide que se muestren tablas que
contengan ms valores que el nmero especificado.

DESCRIPTIVOS
El procedimiento Descriptivos muestra estadsticos de resumen univariados para varias
variables en una nica tabla y calcula valores tipificados (puntuaciones z). Las variables se
pueden ordenar por el tamao de sus medias (en orden ascendente o descendente),
alfabticamente o por el orden en el que se seleccionen las variables (el valor por defecto).
Cuando se guardan las puntuaciones z, stas se aaden a los datos del Editor de datos y
quedan disponibles para los grficos, el listado de los datos y los anlisis. Cuando las
variables se registran en unidades diferentes (por ejemplo, producto interior bruto per cpita y
porcentaje de alfabetizacin), una transformacin de puntuacin z pondr las variables en una
escala comn para poder compararlas visualmente con ms facilidad.
Ejemplo. Si cada caso de los datos contiene los totales de ventas diarias de cada vendedor
(por ejemplo, una entrada para Bob, una para Kim y una para Brian) recogidas cada da
durante varios meses, el procedimiento Descriptivos puede calcular la media diaria de ventas
para cada vendedor y ordenar los resultados del promedio de ventas de mayor a menor.
Estadsticos. Tamao de muestra, media, mnimo, mximo, desviacin tpica, varianza,
rango, suma, error tpico de la media, curtosis y asimetra con sus errores tpicos.
Datos. Utilice variables numricas despus de haberlas inspeccionado grficamente para
registrar errores, valores atpicos y anomalas de distribucin. El procedimiento Descriptivos
es muy eficaz para archivos grandes (de miles de casos).

102

Prof. Willer David Chanduv Puicn

SPSS BSICO
Supuestos. La mayora de los estadsticos disponibles (incluyendo las puntuaciones z) se
basan en la teora normal y son adecuados para variables cuantitativas (medidas a nivel de
razn o de intervalo) con distribuciones simtricas. Se deben evitar las variables con
categoras no ordenadas o distribuciones asimtricas. La distribucin de puntuaciones z tiene
la misma forma que la de los datos originales; por tanto, el clculo de puntuaciones z no es
una solucin para los datos con problemas.
Para obtener estadsticos descriptivos
Elija en los mens:
Analizar
Estadsticos descriptivos
Descriptivos...
Figura 63. Cuadro de dilogo Descriptivos

Seleccione una o ms variables.


Si lo desea, puede:

Seleccionar Guardar valores tipificados como variables para guardar las puntuaciones
z como nuevas variables.

Pulsar en Opciones para seleccionar estadsticos opcionales y el orden de


presentacin.

103

Prof. Willer David Chanduv Puicn

SPSS BSICO
Descriptivos: Opciones
Figura 64. Cuadro de dilogo Descriptivos: Opciones

104

Prof. Willer David Chanduv Puicn

También podría gustarte