Está en la página 1de 59

Introducción a SPSS

Página 4
Módulo Básico SPSS -

Introducción a SPSS

Una vez abierto el software, se observa una


Hoy en día resulta obligatorio para los nuevos profesionales poseer herramientas que le
ventana de “Bienvenida”, en la que se ofrecen
permitan desarrollar su trabajo de forma más óptima y eficiente. Independiente del área en que
distintas opciones, donde la más importante e s l
se desempeñen, tener la capacidad de interpretar datos para transformarlos en conocimiento,
adeabrir archivos utilizados
resulta vital para cualquier profesional y para la posterior toma de decisiones.
recientemente.
SPSS es uno de los Software más conocidos y utilizados para la realización de investigaciones
Pese a lo anterior, se recomienda no utilizar esta
de mercado e investigaciones relacionadas al área de la sociología y psicología. Una de las
ventana, debido a que generalmente no se puede
características fundamentales de SPSS es su facilidad de uso, junto a la potencia e integridad
observar bien la base de datos con la que se está
del software, convirtiéndolo en una de las herramientas más potentes para éste tipo de
trabajando, pudiendo generar errores al momento
trabajos.
de abrir una base de datos particular.

La imagen que se puede ver al lado izquierdo corresponde al icono


de la aplicación, el que por defecto se instala bajo el nombre de
“SPSS para Windows”.

Al iniciar el Software, lo primero que se


despliega es una ventana de información (que se
observa a la izquierda) la que indica la versión
del software, que en este caso corresponde a la
versión 15 para Windows y además muestra la
información referente al propietario de la
licencia.
Módulo Básico SPSS -

Editor de Datos:
Visor de Resultados:
SPSS se compone de dos ventanas de trabajo. La primera recibe el nombre de Editor de
La segunda ventana correspondiente al área de trabajo de SPSS se conoce como “Visor de
Datos (arriba) y es la ventana donde se ingresan los datos con los que se trabajará. Para los
Resultados” y, tal como su nombre lo indica, corresponde a una ventana donde el software
familiarizados con Micosoft Excel ®, esta ventana les resultará familiar y su forma de
despliega los resultados que se obtienen de los distintos análisis realizados. En la sección
trabajo será bastante similar. En las columnas (hacia la izquierda) se introducirán las
izquierda, el software mostrará los títulos de los distintos análisis y los desplegara como una
distintas variables que compongan la base de datos. En términos prácticos, cada pregunta de
diagrama de árbol.
un cuestionario realizado corresponde a una variable.
Por otra parte en la sección derecha se muestran los resultados obtenidos, los cuales pueden
En las filas (hacia abajo) son introducidos los datos, o las respuestas entregadas por los
ser copiados y pegados a software como Microsoft Word ® o Excel ® para realizar
encuestados, o donde sea que se hayan extraído los datos para la realización de la base de
informes u otras acciones que el investigador considere necesarias.
datos. Así, si se entrevistó a 100 personas, hacia abajo deberá haber 100 registros.

Este Editor posee dos tipos de vista: “Vista de datos” y “Vista de variables”. En la primera,
el investigador observará los datos ingresados, mientras que en la segunda se puede acceder
a los atributos de las distintas variables para poder editarlos. Lo anterior será ejemplificado
en el capítulo siguiente.
Trabajo con Bases de Datos
Módulo Básico SPSS -

Trabajo con Bases de Datos

En este apartado se explicará la forma de crear y editar las distintas bases de datos, de manera
Nombre: En esta sección se debe asignar un nombre para la variable. Dicho nombre debe
que se encuentren listas para realizar los distintos análisis requeridos por el investigador.
poseer un máximo de 8 letras y se debe evitar el uso de tildes, símbolos y caracteres como la
letra “ñ”.
Lo primero que se debe hacer antes de ingresar datos a una base de datos, es prepararla para
ello, lo cual debe ser efectuado en el “Editor de datos”, utilizando la “Vista de variables”, lo
Tipo: Se ofrece la posibilidad de asignar una característica a la variable, de manera que ésta
que mostrará una ventana como la que se observa a continuación.
sea más fácil de trabajar y de forma que el software la interprete de manera correcta. A
continuación se muestra la ventana de “Tipos” de variable:

Etiqueta: Para que en el visor de resultados muestre correctamente los nombres de las variables
(y sin el límite de las 8 letras) se puede establecer una etiqueta para ellas, de manera de en este
sector se podrá escribir lo que el investigador considere necesario.

Valores: Para cierto tipo de variables, la etiqueta debe ser definida para más de un valor, como
por ejemplo cuando estamos hablando del sexo de una persona (que puede ser masculino o
femenino), por lo cual hay que decir a SPSS como debe identificar eso. Para ello se utiliza esta
sección, la cual despliega una ventana como la siguiente:

Como se puede observar, en la parte superior se muestra una serie de “características” de las
variables. Sin embargo, no todas se deben utilizar siempre, por lo que solamente se explicará el
funcionamiento de las características que resulten más relevantes para el uso común de SPSS.
Módulo Básico SPSS - Programa Jóvenes Profesionales
Medida: Para que SPSS realice correctamente los análisis solicitados, es necesario Libro de Códigos:
establecer correctamente las unidades de medida de cada una de las variables. Para ello
ofrece tres opciones: Escala, Ordinal y Nominal. A continuación se explicará brevemente Una de las características fundamentales de todo tipo de software de análisis de datos es que
cada una de estas unidades de medidas utilizadas por el software. estos trabajan con números, por lo que cada una de las preguntas (variables) debe ser
definida por un valor o un conjunto de valores numéricos para así ingresarlos al software.

Medida Descripción Una recomendación es la utilización de un libro de códigos, el cual no es más que una ficha
en que se incluyen todos los valores numéricos asignados a cada una de las variables, de
Corresponde a variables numéricas sin una característica especial. manera que al momento de ingresar los datos a SPSS, el investigador, así como los
Escala Por ejemplo, Notas del colegio, Edad, Estatura, Salario, etc. digitadores sepan que rango de valores debe usar cada una de las variables.

A continuación se mostrará un ejemplo práctico para la creación de un libro de códigos, la


Corresponde a variables que representan categorías y además edición de las características de las variables y el ingreso de datos a SPSS.
dichas categorías poseen un ranking implícito. Ejemplo de este
Ordinal tipo de variable es aquella donde hay que seleccionar que tan de
acuerdo o en desacuerdo se está con algo.
Ejemplo Práctico:

Corresponde a variables que representan categorías pero que no La Empresa JPP requiere obtener información acerca de la percepción de sus clientes sobre
Nominal poseen ningún tipo de ranking. Por ejemplo: Tramo de edad, sexo, un nuevo servicio ofrecido desde hace unos meses. Para ello se aplicará un cuestionario a
etc. 30 de sus mejores clientes para conocer la opinión de éstos. Su misión como investigador
será preparar el libro de códigos y la base de datos para que la realización de los análisis sea
efectuada de manera correcta y sin errores. En la página siguiente se presenta el
cuestionario aplicado por la empresa a sus clientes.
Las características anteriormente definidas son las comúnmente utilizadas por los usuarios,
no obstante el investigador puede utilizar el resto de características de manera de
personalizar aún más su base de datos. Una vez que estas características se encuentren
correctamente definidas, el investigador se encuentra con la capacidad de comenzar a
ingresar los datos a la base de datos.
Módulo Básico SPSS - Programa Jóvenes Profesionales
Libro de Códigos:
Marque con una X la alternativa que corresponda:
El libro de códigos es una ficha donde se especifican los valores numéricos con que se
1. Sexo: Masculino Femenino
codificará cada una de las variables del estudio (en este caso del cuestionario), de manera que
el ingreso de los valores a la base de datos se realice uniformemente, evitando así errores
2. Edad: 18 a 29 30 a 49 50 o más
derivados de la digitación de los cuestionarios.

Si bien no existe una forma única de hacer un libro de códigos, a continuación se ofrecerá
Escriba su respuesta en la zona designada para ello:
una vista parcial de un libro de códigos estándar.
3. ¿Cuál es su renta líquida?

Nombre de la
Nº Etiqueta de la Variable Valores
4. ¿Cuántos años de estudio posee? Variable

1 : Masculino
1 Sexo Sexo
5. Marque con una X la alternativa que más se acerque a su percepción del 2 : Femenino
servicio:
1 : 18 a 29
2 Edad Edad 2 : 30 a 49
Muy de De En Muy en 3 : 50 o más años
Indiferente
Acuerdo Acuerdo Desacuerdo Desacuerdo
3 Ren_Liq Renta Líquida
El Servicio ofrece una
nueva experiencia en la 4 Niv_Est Años de Estudio
compra.
1 : Muy de Acuerdo
El precio del servicio es 2 : De acuerdo
acorde a la calidad de El Servicio ofrece una nueva
5.1 Exp_Serv 3 : Indiferente
este experiencia en la compra
4 : En Desacuerdo
5 : Muy en Desacuerdo

1 : Muy de Acuerdo
Muchas Gracias por participar 2 : De acuerdo
El precio del servicio es
5.2 Pre_Serv 3 : Indiferente
acorde a la calidad de este
4 : En Desacuerdo
5 : Muy en Desacuerdo
Módulo Básico SPSS - Programa Jóvenes Profesionales
Edición de las Variables: Posteriormente en “Tipo” hay que escoger “Numérica”, pues se trata de una variable
numérica, sin características especiales, tal como se muestra a continuación:
Una vez listo el libro de códigos, toca el turno de preparar la base de datos para el ingreso
de la información. Lo primero que hay que hacer es definir las características de cada una
de las variables, resultando el libro de códigos una herramienta indispensable para esta
parte del proceso.

A modo práctico solo se hará la edición de las variables 1, 3 y 5.1 del libro de códigos. En
el archivo “BaseDatosC1.sav” se encuentra la base de datos lista para el ingreso de
información, con todas las variables especificadas.

Variable 1 (Sexo):
En “Etiqueta” se debe establecer el Nombre completo que recibirá la variable, en este caso se
Lo primero que se debe insertar es el nombre de la variable. En este caso “Sexo”, bajo la
llamará “Sexo”.
columna “Nombre”, tal como muestra la imagen siguiente (Recuadro rojo).
Siguiendo, bajo “valores” se debe ingresar los valores asignados a cada una de las posibles
respuestas a la pregunta. En este caso “Masculino” o “Femenino”. En este caso los valores
ingresados serán 1 para Masculino y 2 para Femenino, de acuerdo al libro de códigos.

Al hacer clic ahí, se abrirá una nueva ventana, donde se debe ingresar el “Valor” y el
“Nombre” para cada una de las posibles respuestas. La imagen siguiente muestra los valores
que se deben ingresar para la respuesta “Masculino”. Una vez listo se debe presionar el
botón “Añadir” (En recuadro) y el valor de la etiqueta pasará a la zona inferior.
Posteriormente se debe ingresar los valores para “Femenino”, tal como lo muestran las
imágenes siguientes:
Módulo Básico SPSS - Programa Jóvenes Profesionales
Variable 3 (Renta Líquida):

Lo primero que se debe insertar es el nombre de la variable. En este caso “Ren_Liq”, bajo
la columna “Nombre”.

Al definir el “Tipo” de variable, se debe tener en cuenta que esta es una unidad de medida
monetaria, por lo que debe ser definida como tal. En el cuadro de diálogo se ofrece una
opción denominada “Dólar” que es para definir variables monetarias.

Una vez ingresadas ambos valores se debe hacer clic en el botón “Aceptar”.

Finalmente se debe establecer la unidad de medida. Debido a que la variable sexo es una
variable que representa una categoría (Masculino o Femenino) y que a su vez no se puede
establecer un ranking, en la medida que ser Masculino no es superior a ser Femenino o
viceversa, se está hablando de una variable con una escala de medida “Nominal”.
Finalmente, cuando esté toda la variable definida, el software mostrará lo siguiente:

Bajo la columna etiqueta se debe escribir el valor de la etiqueta de acuerdo a lo especificado


por el libro de códigos. En este caso “Renta Líquida” y debido a que esta variable no tiene
respuestas adicionales, el cuadro “Valores” debe ser dejado sin llenar.

En cuanto a la unidad de medida, ya que se trata de una variable donde el encuestado


ingresa un valor numérico (su salario), se está haciendo referencia a una variable de con
unidad de medida de “Escala”, por lo que esa debe ser la unidad de medida asignada. La
imagen de la página siguiente muestra como debe verse la base de datos con la variable 1, 2
y 3 completas:
Módulo Básico SPSS - Programa Jóvenes Profesionales
Bajo la columna etiqueta se debe escribir el valor de la etiqueta de acuerdo a lo especificado
por el libro de códigos. En este caso “El Servicio ofrece una nueva experiencia en la
compra” y posteriormente se debe llenar el cuadro de “Valores” para esta etiqueta, al igual
como se hizo con la variable “Sexo”, pero esta vez utilizando las 5 posibles respuestas, tal
como lo muestra la imagen siguiente:

Finalmente se debe definir una unidad de medida para la variable. Como se puede observar,
Variable 5.1 (El servicio ofrece una nueva experiencia en la compra):
esta variable también sirve para categorizar la información, sin embargo posee la
característica que está definiendo un “ranking” de con la información, de acuerdo a las
Lo primero que se debe insertar es el nombre de la variable. En este caso
posibilidades de respuesta, por lo que se trata de una variable con medida “Ordinal”
“Exp_Serv”, bajo la columna “Nombre”.
En la página siguiente se observa la base de datos editada para cada una de las 5 variables
Al definir el “Tipo” de variable, se debe tener en cuenta que esta es una unidad de medida
del cuestionario, la cual se encuentra disponible en el archivo “BaseDatos1.sav” de manera
numérica, por lo que debe ser definida como tal:
que pueda ser verificado por ud.
Módulo Básico SPSS - Programa Jóvenes Profesionales
La base de datos, una vez completa debiese lucir como la imagen siguiente:

Al volver a la “Vista de datos” se obtendrá una pantalla como la siguiente. En ese momento
SPSS se encuentra listo para que se comience a ingresar los datos en el, de acuerdo a lo
especificado por el libro de códigos. El archivo “BaseDatosC1a” contiene una base de datos
con la información de los 30 encuestados, de manera que se pueda revisar y comprender la Guardar una Base de Datos:
forma en que se ingresa la información en el software.
SPSS tiene una particularidad, por cuanto el archivo de bases de datos, así como el archivo
de resultados se guardan como archivos independientes y con extensiones distintas.

Ítem Extensión
Módulo Básico SPSS - Programa Jóvenes Profesionales
Para Guardar una base de datos, se debe ir al menú “Archivo \ Guardar” y asignar un
nombre al archivo. Posteriormente hacer clic en el botón “Guardar”. Tal como se observa
en las imágenes siguientes:

Abrir una Base de Datos:

Para abrir una base de datos se debe hacer clic en el menú “Archivo \ Abrir \ Datos”, y
buscar el archivo que deseemos abrir, tal como muestran las imágenes siguientes:
Módulo Básico SPSS - Programa Jóvenes Profesionales
Importar Datos de Microsoft Excel® Se recomienda dejar este diálogo tal cual
aparece en el programa, pues
Una forma común de encontrar bases de datos es en formatos distintos a SPSS, como por generalmente cambiar esto puede
ejemplo Microsoft Excel (.xls), Para poder trabajar con bases de datos de otro software generar problemas al investigador
primero se debe importar de manera de transformarla en datos comprensibles para SPSS. cuando no comprende a cabalidad los
software que se están haciendo
La forma de hacer esto es la siguiente: funcionar (SPSS y Excel).

Primero se debe ir al menú “Archivo \ Leer datos de texto”. En la ventana que abre Hacer clic en el botón “Aceptar” para
debemos seleccionar “Excel [.xls]” donde dice “Tipo” y posteriormente buscar y continuar e importar los datos.
seleccionar el archivo Excel que se desee importar.

Una vez importados los datos desde la planilla excel, se abrirá una ventana del “Editor de
datos” que lucirá como la siguiente. Si se va a la “Vista de variables”, el investigador se
dará cuenta que las características de las variables no están ingresadas, por lo que deberá
ingresarlas tal cual se explicó anteriormente:

Una vez seleccionado el archivo se debe hacer clic en el botón “Abrir” y se abrirá un nuevo
cuadro de diálogo.

Página 16
Depurar Datos en SPSS
Por más cuidadosos que seamos, es muy factible que se cometan errores en el proceso de introducción
de los datos, por lo que antes de comenzar a generar análisis es necesario realizar una depuración de la
información como una medida de control para evitar distorsiones en los resultados de los
procedimientos. La mayoría de los errores en la información son causados en la captura o digitación de
los datos; para poder identificar estos errores es indispensable generar tablas de frecuencia por cada una
de las variables del archivo, con el fin de determinar los valores que se encuentran fuera del rango de las
posibles respuestas establecidas.

Desde luego el proceso de depuración se debe realizar después de definir las propiedades de las
variables o de lo contrario se dificultaría bastante la identificación de los valores erróneos.

Para comprender los pasos que conlleva la depuración de los datos, vamos a realizar un ejemplo con el
archivo Depu.sav, que se incluye en la carpeta adjunto. Antes de iniciar el proceso de depuración de los
datos, es necesario abrir el archivo en el editor de datos de SPSS, ya sea mediante la ruta
Archivo...Abrir...Datos o mediante el botón Abrir ( ) ubicado en la barra de herramientas.

Una vez abierto notaremos que el archivo esta compuesto por las variables ID (Número de encuesta),
Género (Sexo del encuestado), Estciv (Estado civil) y Edad (Edad del encuestado) [Fig.3-123]. Es de
gran importancia tener una idea de los datos que contienen el archivo para poder optimizar el proceso de
depuración.

En nuestro archivo de ejemplo, sólo contamos con dos variables Categóricas (Género y Estciv). Para el
género se han definido como valores validos (1= Femenino y 2= Masculino) y para la variable estado
civil las categorías (1= Soltero, 2= Casado, 3= Divorciado, 4= Viudo, 5= Unión libre y 9= No
responde). Las variables ID y Edad son de tipo Escala y por lo tanto no tienen etiquetas de valor.

Figuras 3-123 y 3-124

Una vez abierto el archivo de datos y después de explorar su contenido, estamos listos para empezar con
la depuración de los datos. El primer paso en la depuración corresponde a identificar los valores erróneos;
para realizarlo debemos generar una tabla de frecuencia para cada una de las variables, por lo cual
vamos al menú Analizar y seleccionamos el submenú Estadísticos descriptivos y dentro de él
escogemos la opción Frecuencias [Fig.3-124].
Al hacer clic sobre esta opción aparece el cuadro de diálogo correspondiente a Frecuencias [Fig.3 -125].
Este cuadro se encuentra dividido en dos secciones; la primera de ellas corresponde a la lista de
variables, donde aparecen todas las variables con que cuenta el archivo; la segunda sección corresponde
al listado de variables seleccionadas, donde aparecen las variables a las que se le realizará el cálculo de
frecuencias. Para ingresar una variable al listado de selección, debemos hacer clic sobre ella de manera
que se resalte y sucesivamente hacer clic en el icono Flecha ( ) ubicado entre las dos casillas, de
manera que la variable elegida pasará a la casilla de selección.

Figura 3-125

Para continuar con el ejemplo ingresaremos las variables Edad, Estciv y Género a la casilla de selección
y posteriormente hacemos clic en Aceptar, con lo que las tablas de frecuencia serán representadas en la
ventana visor de resultados. El programa por defecto nos enseña primero la tabla de resumen en la que
incluye los casos validos y perdidos para cada una de las variables. A continuación nos enseña las tablas
de frecuencia de cada una de las variables seleccionadas.

Si nos fijamos en la tabla de frecuencia de la variable Edad, notaremos que existen una gran cantidad de
valores, lo que nos impide observar los valores errados. Para poder identificar un valor errado es necesario
observar en la primera y en la última parte de la tabla y tratar de buscar un valor inferior a 15 o superior
a
70. Sino existen estos valores extremos, no es posible determinar si se cometieron errores en la captura
o digitación de los datos.

Este suceso es exclusivo para las variables de escala. Si continuamos bajando, encontraremos las tablas
de frecuencia para las variables Estado civil [Fig.3-126] y Género [Fig.3-127]. Si nos fijamos en la tabla
de la variable Estado civil, apreciaremos que se encuentran dentro de los datos tres valores erróneos
correspondientes a los números 0, 7 y 10, los cuales representan 6 casos o el 1.9 % de la muestra. Para
facilitar su identificación hemos resaltado estos valores con el color rojo. Si por el contrario nos fijamos
en la variable Género, notaremos que aparece el valor tres (3) y representa 14 casos o el 4.7 % de la
muestra.
Figura 3-126

Figura 3-127

Una vez se han detectado los valores erróneos, debemos ubicar los casos a los que pertenece cada uno de
ellos.
Buscar Datos en SPSS
Para la ubicación de casos SPSS nos ofrece dos posibilidades; la primera consiste en localizar de forma
manual cada uno de los valores errados dentro de la variable, por medio de la opción Buscar. Y la
segunda posibilidad consiste en crear filtros que únicamente habiliten para los procedimientos los
valores errados. Para comprender la diferencia de estos métodos, realizaremos la ubicación de los
valores errados en la variable Género a través del primer método y la ubicación de los valores errados
de la variable Estado civil por medio de los filtros.

Para activar la opción Buscar, debemos ir al menú Edición y seleccionar el procedimiento con el mismo
nombre; al hacer clic sobre él aparece el cuadro de diálogo correspondiente [Fig.3 -128].

Figura 3-128

Para activar esta ventana, debemos hacer clic sobre el nombre de la variable en la que deseamos realizar
la búsqueda, de manera que el nombre de la variable aparezca en la parte superior del cuadro. Una vez
se activa, ingresamos el valor que deseamos localizar en la casilla Buscar qué y sucesivamente hacemos
clic en el botón Buscar siguiente, de manera que el cursor se ubica en el primer caso en el que encuentre
el valor definido; si volvemos a presionar el botón, el programa pasará al siguiente caso que concuerden
con el valor definido.

Dado que en la tabla de frecuencias de la variable Género, logramos detectar que el valor erróneo
corresponde al número tres (3), ingresaremos este valor en la casilla Buscar en y sucesivamente
hacemos clic en el botón Buscar siguiente con lo que el cursor se ubica en la fila número 13. Si
seguimos haciendo clic en el botón obtendremos los casos 19, 25, 33, 43, 52, 64, 81, 116, 131, 165, 207,
236 y 279 respectivamente.

Estos catorce casos corresponden al número de valores tres (3) que nos indicaba la tabla de frecuencias.
Es de gran importancia anotar el número del caso, para poder determinar la encuesta a la que
corresponde. En nuestro archivo, el número de encuesta coincide con el número de fila, por lo que ya
tenemos los números de los formularios en que debemos buscar los errores.
Antes de subsanar los errores de la variable Género, conoceremos el segundo método de búsqueda, con
lo valores erróneos de la variable Estado civil. Para realizar la identificación de los casos por medio de
filtros, es necesario recurrir al procedimiento Seleccionar casos. Para activar este procedimiento,
debemos ir al menú Datos y escoger la opción Seleccionar casos [Fig.3-129]; al hacer clic sobre la
opción, aparece el cuadro de diálogo correspondiente [Fig.3-130], en donde aparecen todas las opciones
de selección con que cuenta el programa.

Figuras 3-129 y 3-130

Este cuadro esta compuesto por cuatro secciones; la primera corresponde a la lista de variables, en
donde aparecen todas las variables con que cuenta el archivo. La segunda sección corresponde a
Selección, en donde encontramos los cinco procedimientos de filtrado del programa. La tercera sección
corresponde al Estado del filtro, donde aparece una leyenda informativa que nos indica el estado actual
de la selección de casos.

La última sección del cuadro corresponde a las Opciones de los casos no seleccionados, en donde
encontramos dos posibilidades (Filtrarlos o Eliminarlos); es recomendable utilizar siempre la opción filtrar
ya que si elegimos la opción eliminar, no podremos recuperar los casos borrados. Para activar alguno de
los métodos de selección, debemos hacer clic sobre él de manera que aparezca un punto en la casilla de
selección y se active el botón ubicado en la parte inferior del método.

Dentro de los métodos de selección encontramos cinco posibilidades; Todos los casos, es la opción que
por defecto utiliza el programa, al seleccionarla se pierden los filtros que se hayan creado con
anterioridad y los resultados, procesos ó procedimientos se realizarán con la totalidad de los casos.

La segunda opción corresponde a Si satisface la condición, este método utiliza una expresión
condicional para seleccionar los casos; si el resultado de la expresión condicional es verdadero, el caso
se selecciona y si el resultado de la expresión es falso o se trata de un valor perdido, entonces el caso no
se selecciona. Al hacer clic en el botón (Si) de esta opción, aparece el cuadro de diálogo correspondiente
[Fig.3 -131], en donde se debe definir la ecuación condicional.
Figura 3-131

Este cuadro esta dividido en tres secciones, la primera corresponde al listado de variables que contiene
el archivo; la segunda a la casilla de ecuación, en donde se debe introducir la expresión que se utilizará
como filtro y la tercera la compone la calculadora de SPSS. Esta calculadora es común en varios de los
cuadros de diálogo del paquete por lo que aprovecharemos la oportunidad y vamos a explicar su
funcionamiento.
Seleccionar casos en SPSS
Para continuar con el ejemplo seleccionamos nuevamente al opción Si satisface la condición y
sucesivamente hacemos clic en el botón Aceptar, con lo que aparecen en la columna de casos del editor
de datos una serie de rayas [Fig.3-138], estas rayas identifican los casos que no cumplen con la
condición y por lo tanto no son seleccionados. Note que en la parte final del archivo, aparece una nueva
variable denominada (filter $). Esta variable contiene un valor cero (0) para los casos que no fueron
seleccionados y un valor uno (1) para los que si lo fueron.

Figura 3-138

Para poder identificar las encuestas (Casos) que contienen valores erróneos, es necesario generar una tabla
de frecuencias para la variable Número de encuesta (ID); para realizarlo nos dirigimos a la barra de
herramientas y seleccionamos el botón Recuperar cuadros de diálogo ( ). Al hacer clic sobre él,
aparece un listado de los cuadros de diálogo de los procedimientos que se han ejecutado en el programa, de
acuerdo al orden inverso de utilización; es decir, el último procedimiento realizado aparece en la
primera posición [Fig.3-139].

Figuras 3-139 y 3-140


En este listado buscamos el procedimiento Frecuencias y hacemos clic sobre él, con lo que aparecerá el
cuadro de diálogo correspondiente [Fig.3-140], si nos fijamos en el listado de variable, notaremos que
ahora aparece una nueva variable llamada filter_$, esta variable contiene los casos que son
seleccionados. Mientras esta variable exista los resultados de los procesos o procedimientos que se
realicen con el programa, estarán basados sólo en los casos seleccionados.

Para continuar con el ejemplo, hacemos clic en el botón Restablecer, de modo que todas las variables
seleccionadas aparezcan nuevamente en el listado. A continuación ingresamos la variable ID en la
casilla de selección y hacemos clic en Aceptar, con lo que se generara en el visor de resultados, la tabla
de frecuencia para los casos que están seleccionados; es decir, aquellos que contienen valores erróneos
para la variable Estciv [Fig.3-141]. Lo realmente útil de esta tabla son los Números de caso ya que con
ellos podemos identificar la encuesta a la que corresponden, de lo que podemos determinar que los
valores erróneos de la variable Estaciv corresponden a los casos 31, 88, 135, 185, 245 y 278
respectivamente.

Figura 3-141

Después de determinar los números de encuesta es necesario ir a la fuente (formularios de encuesta) y


buscar las respuestas adecuadas para cada uno de los valores. Para facilitar esta labor, hemos incluido
en la tabla de la figura [3-142], los números de caso, los valores erróneos y los valores adecuados para
la variable Género; a su vez, en la tabla de la figura [3 -143], se encuentran los mismos datos pero para
la variable Estado civil.

Figura 3-142 y 3-143


Una vez detectados los valores correctos, debemos volver al editor de datos y corregir cada uno de los
casos. Después de efectuar la corrección es necesario guardar los cambios realizados antes de comenzar
con el análisis de la información. Hay que notar que el procedimiento Seleccionar casos sólo es efectivo
cuando existe una variable de identificación dentro de los datos; por este motivo es recomendable
generar una variable de identificación en el momento que se crean los archivos.

A pesar que la depuración de los datos es el proceso más extenso y tedioso del análisis y generación de
reportes, es indispensable realizar siempre la corrección de los errores, ya que de lo contrario los resultados
del análisis pueden sufrir graves alteraciones, al punto que las conclusiones que se obtengan de la
información sean totalmente contradictorias con la realidad. Por ejemplo supongamos que tenemos diez
datos representativos del género de los entrevistados donde los valores sólo pueden tomar los estados

Hombre = 1 y Mujer = 2.

Género = (1, 1, 2, 2, 2, 3, 3, 3, 3, 3)

Si asumimos que los valores 3 son mujeres el resultado seria que el 80% de los entrevistados son
mujeres y si tomamos el valor 3 como hombre obtendríamos que el 70% de los entrevistados son
hombres, en ambos casos estaríamos cometiendo un error y los resultados del análisis van a salir
distorsionados.

A simple vista los resultados no son tan graves pero si asumimos que esta información proviene de una
encuesta realizada por una empresa que se dedica a la fabricación y comercialización de maquinas de
afeitar y este género representa los compradores habituales del producto; el asumir que los valores 3 son
mujeres nos indicaría que nuestros usuarios son las mujeres y por tanto deberíamos dirigir todos
nuestros esfuerzos de mercadotecnia hacia este sector, lo cual podría causar serios problemas en las
ventas de la empresa.
Categorizador Visual de SPSS
Para la versión 12.0 de SPSS se incluye un nuevo método de categorización mejorado, el cual no sólo
realiza la agrupación de los valores de las variables de escala, sino que además nos permite agrupar
variables categóricas. Este procedimiento emplea un asistente que nos orienta durante todo el proceso
de estructuración de la nueva variable, a través de una serie de ventanas en las que se definen
fragmentos específicos de los conjuntos de agrupación.

Este nuevo procedimiento nos ofrece varias alternativas para determinar los límites de cada grupo, ya
sea por medio de intervalos de igual amplitud, porcentajes o desviaciones típicas. A través de este
nuevo procedimiento se puede realizar las opciones:

 Crear variables categóricas a partir de variables de escala continuas. Por ejemplo, se puede
utilizar una variable de escala que contenga los ingresos para crear una variable categórica
nueva que contenga intervalos de ingresos.
 Fusionar un número elevado de categorías ordinales en un conjunto menor de categorías. Por
ejemplo, es posible reunir una escala de evaluación de nueve categorías en tres categorías que
representen: bajo, medio y alto.

Para comprender el funcionamiento de este nuevo procedimiento, vamos a generar un ejemplo


categorizando los datos de las variables Edad (Edad en años) y Educaños (Años estudiados); además
agruparemos las categorías de la variable Consalud (condición de salud), en sólo tres niveles. Para acceder
al procedimiento, debemos dirigirnos al menú Transformar y seleccionar la opción Categorizador
visual [Fig.4-13]; al hacer clic sobre ella, aparece el cuadro de diálogo inicial del procedimiento [Fig.4 -
14]. En este cuadro inicial se deben definir las variables que deseamos categorizar, para lo cual el
procedimiento hace una exploración previa de los datos que contiene cada variable.

Figuras 4-13 y 4-14


En este cuadro inicial encontramos los componentes característicos de SPSS, como la lista de variables;
note que las variables de cadena y las variables nominales no se muestran en el listado , esto se debe ha
que el Categorizador visual requiere que las variables sean numéricas y tengan niveles de medida Ordinal
o de Escala, ya que el procedimiento asume que los valores de los datos cuentan con algún tipo de orden
lógico que puede ser utilizado para agruparlos.

La segunda sección corresponde a la casilla de selección y la tercera sección corresponde a Limitar número
de casos explorados. Para realizar la categorización, el programa efectúa primero una exploración de los
casos para determinar los valores que pueden asumir cada una de las variables seleccionadas. La limitación
de casos puede ahorrar tiempo, sobre todo si el archivo cuenta con elevado número de casos, aunque es
recomendable evitar esta alternativa, ya que la distribución de los valores puede verse seriamente afectada
si se realiza la categorización a través de desviaciones típicas.

Continuando con el ejemplo, vamos a ingresar las variables Edad, Educaños y Consalud, por lo que
debemos seleccionarlas en el listado de variables y posteriormente hacer clic en el botón Flecha ( )
ubicado en el medio de las casillas. Una vez se ingresan las variables, hacemos clic en el botón
Continuar con lo que aparece el cuadro de diálogo principal [Fig.4 -15]; para activar las casillas de este
cuadro es necesario seleccionar una de las variables del listado, en nuestro caso optaremos por la
variable Edad.

Figura 4-15

Este cuadro esta compuesto por múltiples secciones, cada una de ellas cumple un objetivo específico
dentro de la definición de los conjuntos de agrupación. La primera sección del cuadro corresponde a la
lista de variables [Fig.4-16]; en esta casilla aparecen las variables que fueron seleccionadas en el cuadro
de diálogo inicial. Este listado se puede ordenar de acuerdo al nivel de medida (de Escala u Ordinal) o
por el nombre de las variables; pulsando en los encabezados de las columnas Medida y Variables.
Figuras 4-16 y 4-17

La segunda sección la componen los Casos explorados y los Valores perdidos [Fig.4-17]; la primera
casilla indica el número de casos que fueron explorados para la variable activa. Todos los casos explorados
sin valores perdidos definidos por el usuario o del sistema, se emplean en la generación de la
distribución de valores del Categorizador visual. La segunda casilla (Perdidos), nos indica el número de
casos explorados con valores perdidos definidos por el usuario y perdidos del sistema. Es importante
resaltar que los valores perdidos no son incluidos en ninguno de los intervalos de la nueva variable.
Partes del Categorizador Visual de SPSS
La tercera sección la componen las opciones de variable [Fig.4 -18]; dentro de estas opciones encontramos
el nombre y la etiqueta de la variable actual, así como dos casillas para definir el nombre y la etiqueta de
la variable de resultado. Por defecto el programa aplica a la variable de resultado la misma etiqueta de la
variable de origen, pero le anexa la palabra Categorizada. De igual forma, en esta sección encontramos
las casillas Mínimo y Máximo, las cuales nos informan los valores extremos de la variable activa; estos
valores son hallados a través de la exploración de los datos.

Figura 4-18

La cuarta sección del cuadro la compone la representación grafica de los valores no perdidos [Fig.4-19];
en esta sección encontramos un histograma, el cual muestra la distribución de valores útiles
correspondiente a la variable seleccionada actualmente, basándose en los casos explorados. En este
histograma, el mínimo y el máximo se basan en los casos explorados. Si no incluyen todos los casos en
la exploración, es posible que no se refleje con precisión la distribución real, sobre todo si el archivo se
ordenó de forma ascendente o descendente antes de realizar la categorización.

Figura 4-19

La cuarta sección la compone la Rejilla de intervalos [Fig.4-20]; en esta sección se definen los puntos
de corte superiores de cada intervalo, así como las etiquetas de valor opcionales para cada rango. En la
parte superior de la rejilla encontramos las columnas Valor y Etiqueta. En la columna Valor, se deben
introducir los valores de corte de cada intervalo ó si se desea, permitir que el programa los genere
automáticamente basándose en los criterios que se le definan.

Por defecto, se incluye automáticamente dentro de la columna un punto de corte con el valor
SUPERIOR. Este intervalo contendrá cualquier valor no perdido que se encuentre por encima del último
punto de corte definido; a su vez el primer intervalo definido por el punto de corte inicial, incluirá todos
los valores que sean menores o iguales a dicho número. En la columna Etiquetas se deben ingresar las
leyendas informativas que describan los valores de la nueva variable categorizada.
Puesto que los valores de la nueva variable sólo serán números enteros consecutivos, las etiquetas de valor
surgen como una opción bastante útil, sobre todo en los resultados de los procedimientos que se realicen
con esta nueva variable, ya que le proporciona al usuario orientación sobre los rangos que componen
cada intervalo. Las etiquetas pueden ser introducidas manualmente o mediante la opción Crear
etiquetas, con lo que se generan de forma automática.

Figura 4-20

La quinta sección de este cuadro la componen las opciones de procedimiento; dentro de estas opciones
encontramos la propiedad Limites Superiores [Fig.4-21]; esta propiedad controla el tratamiento de los
valores de los límites superiores introducidos en la columna Valor de la rejilla. Si se selecciona la
opción Incluidos [<=], los casos que cuenten con el número especificado en la casilla Valor serán
incluidos en el intervalo. Por ejemplo, si se especifica el número 25 dentro de la casilla Valor, los casos
con el valor exacto 25 se incluirán en el intervalo.

Si por el contrario se activa la opción Excluidos [<], los casos que cuenten con el número especificado
en la casilla Valor no serán incluidos en el intervalo y se tomaran únicamente los valores que estén por
debajo del número especificado. Por ejemplo, si define el número 25, los casos con el valor exacto (25)
se excluyen del primer intervalo, de esta forma se incluirán todos los casos con valor menor a 25.

Figuras 4-21 y 4-22

Las otras opciones de esta sección corresponden a Crear puntos de corte [Fig.4-22]; al activar esta
opción aparece un nuevo cuadro de diálogo, por medio del cual podemos pedirle al programa que
genere las categorización, ya sea por intervalos de igual amplitud, Percentiles iguales basados en la
exploración de los casos ó mediante puntos de corte basados en la media y la desviación típica de los
casos explorados. Simultáneamente, aparece en esta casilla la opción Crear etiquetas; al activarla, el
programa genera leyendas descriptivas para los valores enteros contenidos en la nueva variable
categorizada, de acuerdo al tratamiento especificado para los límites superiores (incluidos o excluidos).

La última opción corresponde a Invertir escala; al activarla los valores de la variable de resultado
asumen el orden inverso al que aparece en la rejilla. Por ejemplo, si en la rejilla aparecen los valores
1=Bajo, 2=Medio y 3=Alto, al activar la opción estos valores aparecerán en la variable de resultado
como 1=Alto, 2=Medio y 3=Bajo.
La última sección del cuadro la compone la propiedad Copiar categorías [Fig.4 -23]. Por medio de estas
opciones, podemos extraer las especificaciones de categorización definidas para la variable actual y
aplicárselas a otras variables (A otras variables) ó extraer la categorización de una variable externa y
aplicársela a la variable actual (De otra variable).

Figura 4-23

Para comprender cada uno de los elementos que componen el procedimiento Categorizador Visual de
SPSS, en la siguiente lección vamos a realizar la categorización de las variables Edad, Educacion en
Años y Consalud.
Asignar Rangos de Forma Manual en SPSS
Para comprender los elementos que componen el procedimiento, vamos a realizar la categorización de
las variables que seleccionamos en el cuadro de diálogo inicial. Comenzaremos el proceso con la
variable Educaños, por lo que debemos hacer clic sobre ella en el listado de variables, con lo que los
componentes del cuadro se actualizan de acuerdo a los datos explorados para la variable. Si nos fijamos en
el histograma de distribución [Fig.4-24], notaremos que los valores varían desde cero (0) hasta veinte
(20).

Figura 4-24

El categorizador visual nos ofrece dos formas para generar los intervalos (Manual o Automatico); para
la variable Educaños, vamos a emplear el método manual, por lo que debemos asignar los rangos antes
de introducir los puntos de corte superior. Dado que esta variable representa los años de educación con
que cuenta cada uno de los entrevistados, vamos a crear tres rangos; el primero reúne toda la educación
Básica (Primaria, Secundaria y Preparatoria), para este nivel se requiere cursar once años (11).

El segundo nivel corresponde a Profesional, para el que se requiere cinco años (5) y el último nivel
corresponde a Especialización en donde se reúnen los diplomados, Postgrados, Master y Doctorados; dado
que el tiempo empleado para cada uno de estos estudios es distinto, le pediremos al programa que
agrupe todos los valores que superen los dieciséis años (16) de estudio. De acuerdo a estos niveles los
puntos de corte quedarían ubicados en once (11) y dieciséis (16), respectivamente.

Para ingresar los puntos de corte, debemos ir a la sección Rejilla y hacer clic sobre la casilla vacía de la
columna Valor, de modo que se resalte con un marco negro [Fig.4 -25]. Una vez se activa la casilla
ingresamos el número once (11) y posteriormente hacemos clic en la casilla de la columna Etiqueta, con
lo que el valor once pasa a la fila número uno de la rejilla [Fig.4-26].

Figuras 4-25 y 4-26


Para ingresar el segundo punto de corte, realizamos la misma operación; es decir, activamos la casilla
de la fila 3, e ingresamos el número 16; para terminar hacemos clic en la columna Etiqueta, de manera
que el valor 16 pase a la Fila número dos [Fig.4-27]. Por último, sólo nos resta ingresar las etiquetas de
valor para cada uno de los intervalos; para realizarlo basta con activar la respectiva casilla e ingresar las
letras. Después de declarar las etiquetas obtenemos los resultados de la figura [4 -28].

Figuras 4-27 y 4-28

Si nos fijamos en el histograma, notaremos que a medida que definimos los puntos de corte, van
apareciendo unas líneas indicativas [Fig.4-29]. Estas líneas nos permiten modificar los puntos de corte
de forma manual, haciendo clic sobre una de ellas y manteniéndolo el botón oprimido podemos
desplazar la línea seleccionada hacia el costado que deseemos, lo cual es de gran utilidad si no se tiene
claro los limites de los intervalos, ya que nos permite ir modificando los puntos hasta obtener los
resultados deseados. El programa le asigna el color rojo a la línea que esta seleccionada en el momento. De
igual manera, podemos notar que el nivel Básico abarca desde el número cero hasta el número 11, el
nivel Profesional abarca desde el número 12 hasta el número 16 y el nivel Especialización abarca todos
los valores superiores a 16 (17, 18, 19, 20, etc).

Figura 4-29

Después de definir los puntos de corte, sólo nos resta asignar el nombre y la etiqueta a la nueva variable,
para facilitar el reconocimiento de esta variable, le asignaremos el nombre Rangeduc y la etiqueta
Rangos de Educación.
Crear Puntos de Corte Automaticamente
Una vez definidos todos los parámetros de la nueva variable categorizada, podemos continuar con la
variable Edad, para lo que hacemos clic sobre ella en la lista de variables, de manera que los datos del
cuadro se actualicen y nos muestren los resultados de la exploración de esta variable. Si nos fijamos en
los valores Mínimo y Máximo, notaremos que los datos varían entre los valores 18 y 44, lo que nos
indica que contamos con una amplitud de 26. dado que en la variable anterior empleamos la
categorización manual, vamos a utilizar en la variable Edad el método de categorización automática, con el
fin de conocer las diferentes opciones que nos ofrece el procedimiento.

Para acceder al método de categorización automática, debemos hacer clic en el botón Crear Puntos de
corte, con lo que surge el cuadro de diálogo correspondiente [Fig.4 -30]. En este cuadro encontramos
los tres métodos de generación de puntos de corte con que cuenta el programa. El primero de ellos
corresponde a Intervalos de igual amplitud, el cual genera categorías con la misma distancia entre los
limites del rango (por ejemplo, 1–10, 11–20, 21–30, etc.).

Figura 4-30

Para determinar los intervalos, el programa requiere que le definamos por lo menos dos de los tres criterios
del procedimiento [Fig.4-31]. El primero de estos criterios corresponde a Posición del primer punto de
corte; este valor define el límite superior de la primera categoría o categoría inferior (por ejemplo, el
valor 10 indica un intervalo que incluye todos los valores hasta 10). El segundo criterio corresponde a
Número de puntos de corte; este valor identifica el número de intervalos que deseamos obtener, es
necesario saber que el programa generará los intervalos correspondientes al número de puntos de corte
definidos más uno. Por ejemplo, 9 puntos de corte generan 10 intervalos.
El tercer criterio corresponde a Amplitud, el cual define la longitud de cada intervalo. Por ejemplo, el
valor 10 categorizará la variable Edad en intervalos de 10 años. Adicionalmente el programa nos ofrece
una casilla informativa denominada Posición del último punto de corte; al frente de esta casilla
aparecerá el valor numérico del último punto de corte, de acuerdo a los valores de criterio que se hayan
definido.

Figura 4-31

Continuando con el ejemplo, vamos a pedirle al programa que genere cuatro puntos de corte (Cinco
intervalos) y que el primero de los puntos se ubique en la posición 24. Para realizarlo, debemos hacer
clic en la casilla correspondiente a Posición del primer punto de corte e ingresar el valor 24,
sucesivamente ingresamos en la casilla Número de puntos de corte el valor 4; al hacer clic en la tercera
casilla, automáticamente aparecen los valores 5 en Amplitud y 39 en Posición del último punto de corte
[Fig.4 - 32]; esto se debe a que el programa sólo requiere que se le especifiquen dos de los criterios y
con ellos calcula los demás.

Figuras 4-32 y 4-33

Una vez definidos los puntos de corte, se activa el botón Aplicar; al hacer clic en él, se cierra el cuadro
de diálogo y los valores de cada punto de corte superior aparecen en la columna Valor de la sección
Rejilla [Fig.4-33]. Note como el procedimiento automáticamente nombre al último intervalo como
Superior. Si nos fijamos en las líneas de corte del histograma [Fig.4-34], notaremos cada uno de los
intervalos; el primero va desde 1 hasta 24 (<=24), el segundo va desde 25 hasta 29, el tercero desde 30
hasta 34, el cuarto desde 35 hasta 39 y el último recoge todos los valores que superen los 40 años.
Figura 4-34

Desde luego esta distribución es el resultado del primer método de categorización automática; para
conocer los demás métodos, vamos a volver al cuadro de diálogo Crear puntos de corte, por lo que
hacemos clic sobre el botón correspondiente. Una vez aparece el cuadro seleccionamos la segunda opción,
correspondiente a Percentiles iguales basados en los casos explorados [Fig.4-35]; en este método
encontramos sólo dos criterios correspondientes al Número de puntos de corte y Porcentaje de casos.

Al contrario que el método anterior, este procedimiento de percentiles genera intervalos con un número
aproximadamente igual de casos en cada categoría y únicamente requiere que se le defina uno de los
criterios. Al definir el número de puntos de corte, el programa genera los intervalos correspondientes al
número de puntos de corte más uno. Por ejemplo, tres puntos de corte generan cuatro categorías percentiles
(cuartiles), conteniendo cada una el 25% de los casos.

Figuras 4-35

Si por el contrario se definen los porcentajes de casos, el programa lo asume como la amplitud de cada
intervalo, expresado en el porcentaje total de casos. Por ejemplo, el valor 33,3 generaría tres categorías
(dos puntos de corte), conteniendo cada una el 33,3% de los casos. Es necesario aclarar que si la
variable de origen contiene un número relativamente pequeño de valores distintos, o un gran número de
casos con el mismo valor, es posible que se obtenga menos categorías que las solicitadas.

Continuando con el ejemplo, vamos a pedirle al programa que genere cinco intervalos, por lo que debemos
ingresar en la casilla Número de puntos de corte el valor 4. Note como una vez se ingresa el número,
aparece en la casilla % de casos un valor porcentual [Fig.4-36], el cual representa el promedio de casos
que contendrá cada uno de los intervalos.
Figura 4-36

Después de definir los puntos de corte hacemos clic en Aplicar, con lo que surge el aviso Se
reemplazarán las definiciones de los puntos de corte existente. Una vez hacemos clic en Aceptar, se
cierra el cuadro y los valores de cada punto aparecen en la columna Valor de la sección Rejilla [Fig.4-
37]. Si nos fijamos en los puntos de corte superior, notaremos que sólo uno de ellos cambia con respecto
al método anterior; en esta oportunidad el primero de los puntos se ubica en el valor 25.

Figura 4-37
Recodificar Variables
Recodificar Variables con SPSS El primero de estos nuevos componentes corresponde a Variable de resultado; a través de esta sección
se definen las propiedades principales de la variable de resultado, como lo son el Nombre y la
Etiqueta. El nombre que se le defina a la nueva variable debe cumplir con las características requeridas por
En algunas ocasiones los datos de las variables cuentan con valores muy dispersos que nos dificultan el programa como la longitud (64 caracteres máximo para versión 12.0 y 8 caracteres para las demás
su interpretación o sencillamente no se prestan para el análisis estadístico. Para subsanar estos versiones), no comenzar con un número, etc.
inconvenientes, SPSS cuenta con el procedimiento Recodificar, el cual nos permite transformar los
datos de una o varias variables numéricas o de cadena, ya sea reasignando los números representativos La asignación del nombre es indispensable, ya que el programa no permite ejecutar la recodificación hasta
de cada categoría o agrupando en rangos los valores de las variables existentes, según sean las que se defina una variable de resultado. En la opción etiqueta podemos ingresar una pequeña leyenda
necesidades del análisis o el criterio del investigador. explicativa que permita reconocer fácilmente el contenido de la variable; este parámetro no es
obligatorio pero es recomendable para facilitar la interpretación de los valores en los resultados.
La principal virtud de este procedimiento, radica en la posibilidad de asignar los números
representativos de cada categoría de acuerdo a nuestras necesidades, lo que nos permite agrupar
Para continuar con el ejemplo vamos a recodificar la variable área de trabajo (areatrab); lo primero que
valores que no son consecutivos; como por ejemplo, el 1 y el 5. Este procedimiento nos ofrece dos
debemos hacer es seleccionarla en la lista de variables e ingresarla en la casilla de selección haciendo
opciones En las mismas variables y En distintas variables; la principal diferencia de estas dos
clic en el botón flecha ( ). Una vez ingresada la variable, aparece al costado derecho de ella un signo
posibilidades radica en el destino de los resultados; es decir, el lugar en donde se guardarán los nuevos
de interrogación (?); este signo se mantendrá hasta que se le defina un nombre a la nueva variable. A
valores asignados.
continuación ingresamos en la casilla Variable de resultado el nombre Recarea y la etiqueta Área de
trabajo recodificada. Por último hacemos clic en el botón Cambiar, con lo que el signo de interrogación
Dado que SPSS tiene la capacidad de trabajar con un gran número de variables (33.000 aprox), es
desaparece y en su lugar aparece Recarea [areatrab → Recarea].
recomendable utilizar siempre la opción correspondiente a En distintas variables, ya que de esta
manera podemos conservar los datos originales. Es necesario resaltar que SPSS permite agrupar la
La segunda nueva sección del cuadro la compone el botón Valores antiguos y nuevos; al hacer clic
información pero NO permite desagruparla; es decir, podemos utilizar los procedimientos para
sobre él, aparece un nuevo cuadro de diálogo [Fig.4-50]; en este cuadro se definen los valores que
convertir una variable de escala a una variable de categorías (Ordinal), pero no en viceversa.
deseamos cambiar y se especifican a su vez el nuevo valor que le será asignado.
Para comprender la metodología utilizada en la recodificación, vamos a generar un ejemplo con la variable
Área de trabajo (areatrab), la cual contiene las diferentes áreas en la que se desempeñan cada uno de los
empleados de la empresa Dkfé tradición (1=Operario, 2=Planeación, 3=Mercadeo, 4=Ventas,
5=Administración, 6=Ingeniero de proceso y 7=Servicios generales). Para acceder al procedimiento,
debemos ir al menú Transformar y seleccionar el submenú Recodificar, con lo que aparecen las dos
opciones con que cuenta [Fig.4-48].

Dado que la diferencia en los cuadros de diálogo de estas dos opciones es muy pequeña, elegiremos la
opción correspondiente a En distintas variables. Al hacer clic en ella, aparece el cuadro de diálogo
correspondiente a Recodificar en distintas variables [Fig.4-49]; este cuadro contiene los elementos
habituales de los cuadros de diálogo, como la lista de variables y la casilla de selección, pero además
incluye tres secciones adicionales denominadas Variable de resultado, Valores antiguos y nuevos y
Condicional.

Figura 4-50

Dentro de este cuadro encontramos cuatro diferentes secciones (Valores antiguos, Valores nuevos, Casilla
de selección y las opciones de recodificación), cada una de estas secciones define un segmento
específico de la recodificación y su aplicación depende exclusivamente de los criterios del investigador
de acuerdo a las necesidades del análisis. Los parámetros que se definan en este cuadro serán aplicados
en la nueva variable de resultado.

Figuras 4-48 y 4-49


Valores Antiguos y Nuevos - Recodificar 2 La tercera sección del cuadro corresponde a la Lista de Recodificación. En esta sección se genera un
listado con las especificaciones de los valores antiguos y nuevos. Dentro de la sección encontramos las
opciones Añadir (Agrega un valor a la lista), Cambiar (Modifica un valor de la lista) y Borrar (Elimina
La primera sección del cuadro corresponde a Valor antiguo. Dentro de esta sección se determinan los un valor de la lista). Para agregar un valor es necesario especificar los valores antiguos y el valor
valores que se van a recodificar; podemos modificar valores individuales, rangos de valores y los nuevo; después de lo cual se hace clic en el botón añadir para ingresarlo a la lista.
valores perdidos (ya sea del sistema o definido por el usuario). Los rangos y los valores perdidos del
sistema no se pueden seleccionar para las variables de cadena, ya que ninguno de estos conceptos es Para modificar la recodificación de un valor es necesario seleccionarlo de la lista, modificar los datos y
aplicable a este tipo de variables. Esta sección comprende siete diferentes opciones, entre las que hacer clic en el botón Cambiar y los valores se modifican dentro de la lista. Para eliminar una
encontramos: asignación, se debe seleccionar en el listado y sucesivamente hacer clic en borrar con lo que
desaparece de la lista. Antes de terminar la asignación de variables es indispensable añadir todas
 Valor: corresponde a un valor antiguo individual que se va a recodificar en un valor (número) nuevo. El
recodificaciones pendientes o de lo contrario se perderán.
tipo de datos del valor introducido (numérico o de cadena), debe coincidir con el tipo de datos de la
variable que desea recodificar; es decir, no podemos asignar un carácter (letra) como valor antiguo si
La última sección del cuadro la componen las Opciones de recodificación. En esta sección
nuestra variable original es numérica.
encontramos dos opciones; la primera corresponde a Las variables de resultados son cadenas, la cual
 Perdido por el sistema: Son valores asignados por SPSS cuando los valores de los datos no están definidos
define la nueva variable recodificada como variable de cadena (alfanumérica); además nos ofrece una
de acuerdo al tipo de formato que haya especificado (Por ejemplo, letras dentro de una variable
casilla en la que podemos establecer el ancho de la variable. La segunda opción corresponde a Convertir
numérica), así como los campos que se encuentren vacios en una variable numérica (Los valores
numéricos perdidos del sistema se muestran como puntos). Para las variables de cadena no se pueden
cadena numérica a números, en donde se convierten los valores de cadena que contienen caracteres de
tener valores perdidos del sistema, ya que el espacio en blanco es tomado como un carácter. Estos valores números (Ejemplo, ‘5’) en valores numéricos. A las cadenas que contengan cualquier carácter que no
son definidos por el programa como SYSMIS. sean números, así como las que contengan un signo opcional (+ ó -) se les asignará el valor perdido por
 Perdido por el usuario: son observaciones que tienen valores que han sido declarados como perdidos por el sistema. Esta opción sólo se activa cuando la variable de origen es de cadena, de lo contrario no se
el usuario. Generalmente estos valores representan razones por las cuales no se tiene información como habilita.
por ejemplo No Sabe, No Responde, No Aplica. Estos valores son definidos por el paquete como MISSING.
 Rango: dentro de las opciones de rango encontramos tres posibilidades, la primera nos permite Continuando con el ejemplo vamos a recodificar los valores de la variable Área de trabajo (areatrab) en
especificar el limite inferior y superior del rango; la segunda nos permite asignar los caso desde el menor sólo tres niveles; el primer nivel comprenderá los casos que cuenten con los valores 2 y 5 (Planeación y
valor dentro de la variable hasta un valor definido por el investigador y la tercera nos permite agrupar los Administración). El segundo nivel comprende los casos con valores 3 y 4 (Mercadeo y Vendedores) y
casos desde un valor definido por el investigador hasta el mayor de los valores. Estas opciones no están el tercer nivel comprende los casos con los valores 1, 6 y 7 (Operario, Ingeniero de proceso y servicios
disponibles para variables de cadena. generales).
 Todos los demás valores: al seleccionar esta opción, se incluirán todos los valores que no han sido
definidos dentro de las especificaciones anteriores y les asigna el valor deseado en la variable de El objetivo de esta recodificación es agrupar las diferentes áreas en las que se desempeñan los
resultado. empleados de la empresa en sólo tres niveles generales (Administrativa, Comercial y Operativa)
[Fig.4-51]. Si nos fijamos en los valores que componen cada uno de los nuevos niveles, notaremos que
La segunda sección del cuadro corresponde a Valor Nuevo. En esta sección se definen los valores que están dispersos, por lo que sería imposible realizar esta agrupación con el procedimiento
tomaran los datos en la variable de resultado después de la recodificación. Dentro de las opciones de Categorizador visual.
los nuevos valores encontramos:

 Valor : En esta casilla se introduce un valor numérico individual, el cual representará a uno o más de los
valores antiguos. Si se desea recodificar una variable numérica en una variable de cadena, también se
debe seleccionar la opción Las variables de resultados son cadenas, con lo que el programa define los
valores numéricos como caracteres (Por ejemplo: el número 5 lo asume como el carácter ‘5’).
 Copiar valores antiguos: esta opción retiene el o los valores antiguos que no se hayan incluido dentro de Figuras 4-48 y 4-49
de alguno de los nuevos valores. Si algunos de los datos no requieren la recodificación, se utiliza esta
opción para incluirlos. Cabe aclarar que cualquier valor antiguo que no sea especificado no será incluido
en la nueva variable, y en su lugar aparecen espacios en blanco.
 Perdido por el sistema: esta opción recodifica el valor antiguo, en un valor perdido por el sistema. Los
valores perdidos por el sistema no son utilizados en los cálculos. Esta opción no se encuentra disponible
para las variables de cadena ya que el carácter espacio es valido.
Definir Valores Antiguos y Nuevos: Recodificar 3
La recodificación la realizaremos para cada uno de los niveles, iniciando con el Administrativo. Lo
primero que debemos hacer es activar la casilla Valor en la sección Valores antiguos haciendo clic
sobre ella; una vez activa ingresamos el número 2 y sucesivamente activamos la Casilla Valor en la
sección Valor nuevo, en donde ingresamos el número 1; para terminar hacemos clic en el botón
Añadir, con lo que aparece en la casilla de listado la frase (2→1) [Fig.4-52].

Figura 4-54

Para el tercer y último nivel, debemos activar primero la casilla valor en la sección valores antiguos e
ingresar en ella el número 1, sucesivamente ingresamos en la casilla valor de la sección Valor nuevo el
número 3; para terminar hacemos clic en el botón Añadir con lo que aparece en la lista la leyenda
(1→3) [Fig.4-55]. Si nos fijamos en el listado de expresiones, notaremos que el valor que acabamos de
definir aparece antes de la expresión del segundo nivel, esto se debe a que el programa va organizando
las expresiones de acuerdo si se tratan de valores específicos o rangos.

Figura 4-52

Después de definir el primer valor, debemos definir el segundo por lo que ingresamos en la casilla
valor de la sección valores antiguos el número cinco y sucesivamente ingresamos en la casilla valor de
la sección valor nuevo el número 1; al hacer clic en el botón Añadir aparece en la casilla de listado la
frase (5→1) [Fig.4-53]. Si nos fijamos en las expresiones, notaremos que le pedimos al programa que
incluya los valores 2 y 5 en la nueva variable y que a su vez les asigne el valor 1.

Figura 4-55

Continuando con la recodificación, sólo nos basta finalizar con el tercer nivel de trabajo, por lo que
activamos la primera opción de rango (Desde / Hasta), e ingresamos en la primera casilla el número 6 y
en la segunda casilla el número 7; sucesivamente ingresamos en la casilla valor de la sección Valor
nuevo el número 3 y posteriormente hacemos clic en el botón Añadir, con lo que aparece en el listado
la frase (6 thru 7 →3) [Fig.4-56].

Figura 4-53

Después de definir el primer nivel, procedemos con el segundo. Para el segundo nivel activaremos la
primera opción de rango de la sección valores antiguos correspondiente a (Desde / Hasta). En la
primera casilla de esta opción ingresamos el valor 3 y en la segunda casilla el valor 4, sucesivamente
ingresamos el número 2 en la casilla valor de la sección Valor nuevo; para terminar hacemos clic en el
botón Añadir con lo que aparece en la casilla de listado la frase (3 thru 4 →2) [Fig.4-54]. Si nos
fijamos en la expresión, notaremos que le hemos pedido al programa que incluya los valores desde el 3
hasta el 4 en la nueva variable y que a su vez le asigne el valor 2.
Figura 4-56
Si nos fijamos en la expresión del tercer nivel, notaremos que le pedimos al programa que incluya en la
nueva variable los valores 1, 6 y 7 y que a su vez les asigne a ellos el valor 3. Después de ingresar todas
las expresiones hacemos clic en Continuar con lo que volvemos al cuadro de diálogo principal del
Condicionar Casos - Recodificar Variables 4
procedimiento. Si no se han añadido todas las expresiones, aparece en la pantalla el mensaje Se
La última sección del procedimiento Recodificar corresponde a la Condicional. A través de esta
perderán todas las operaciones pendientes de Añadir o cambiar.
opción, podemos restringir el número de casos que serán recodificados mediante expresiones de
comparación (Ecuaciones), las cuales pueden estar sujetas a cualquiera de las variables del archivo; es
decir podemos utilizar una o más variables del archivo para crear la restricción sin importar si estas
variables serán recodificadas o no.

Para utilizar una expresión condicional debemos hacer clic en el botón SI... del cuadro de diálogo
principal. Al hacer clic en él, aparece un nuevo cuadro de diálogo correspondiente a Si los casos [Fig.4-
57]; este cuadro nos permite aplicar transformaciones de los datos para subconjuntos de casos
seleccionados por medio de expresiones condicionales. Una expresión condicional devuelve un valor
verdadero, falso o perdido para cada caso. Si el resultado de una expresión condicional es verdadero, la
transformación se aplicará al caso. Si el resultado de una expresión condicional es falso o perdido, la
transformación no se aplicará al caso.

Figura 4-57

Este cuadro de diálogo esta dividido en las secciones Lista de variables, Zona de ecuación (en esta
casilla se ingresa la expresión de condición), Calculadora de SPSS y las posibilidades de selección
donde encontramos la posibilidad de escoger las opciones Todos los casos (Aplica la transformación a
todos los casos) o la opción Incluir si el caso satisface la condición (Aplica la transformación sólo a
los casos que cumplen las condiciones especificadas en la expresión).

Generalmente la mayoría de las expresiones condicionales utilizan al menos uno de los seis operadores de
relación (<, >, <=, >=, = y ~=) ubicados en el teclado de calculadora. Las expresiones condicionales
pueden incluir nombres de variable, constantes, operadores aritméticos, funciones numéricas, variables
lógicas y operadores relaciónales.
Las condicionales se utilizan cuando deseamos seleccionar sólo un fragmento de la información; es decir,
nuestra atención esta dedicada exclusivamente a un grupo específico de respuestas. Por ejemplo,
supongamos que deseamos saber cuantos de los entrevistados son hombres y se encuentran dentro del
área administrativa, con el fin de determinar su conducta. Para realizarlo, debemos definir la
restricción en la ventana de condiciones, por lo que hacemos clic en la opción Incluir si el caso
satisface la condición, de manera que se activen todas las secciones de la ventana.

A continuación seleccionamos en el listado la variable Género y la ingresamos en la casilla de ecuación


e inmediatamente ingresamos el signo igual (=) por medio del teclado de la calculadora, así como el
número dos (2) el cual representa a las personas del genero Masculino; la expresión debe quedar
(GÉNERO = 2). Una vez introducida la ecuación correctamente hacemos clic en Continuar con lo que
volveremos al cuadro de diálogo Recodificar en distintas variables [Fig.4-58]; si nos fijamos en la
parte inferior del cuadro de diálogo notaremos que aparece la expresión de la restricción que se ha
definido.

Figuras 4-58 y 4-59

Una vez definidos todos los parámetros del procedimiento, hacemos clic en el botón Aceptar con lo que
se ejecuta la recodificación y la variable de resultado aparece en la parte final del editor de datos de
SPSS [Fig.4-59].

Esta variable contendrá sólo los niveles del área de trabajo de los casos que pertenezcan al género
masculino; para los casos pertenecientes al género Femenino se le asignan valores perdidos por el sistema;
es decir, aparece un espacio en blanco (. ). A cada nueva variable generada por la Recodificación se le
debe definir las propiedades por medio de la pestaña vista de variables o el procedimiento Definir
propiedades de variables, ya que por defecto el programa las crea sin propiedades.
Análisis de Variables - Tabla de Contingencia

Página 26
Módulo Básico SPSS - Programa Jóvenes Profesionales
1. Al igual que la mayoría de los
Análisis de Variables Categóricas análisis, se debe i r al menú
“Analizar” y posteriormente a
“Estadísticos descriptivos”, donde
En las investigaciones de mercados y otros trabajos de investigación, en ocasiones, es se debe escoger la opción “Tablas de
importante entregar resultados categorizados, es decir, agrupados por alguna categoría o contingencia...”
variable que sirva para separar los resultados y dar visiones separadas de estos, como por
ejemplo cuando se entregan resultados separados para mujeres y hombres.

Para realizar estas labores SPSS posee una herramienta de análisis que se llama “Tablas de
contingencia”, que consiste en una tabla que muestra información categorizada de acuerdo a
los parámetros que se haya definido previamente.

Para que este tipo de análisis tenga sentido, se necesita al menos de dos variables: una variable
que sirva para categorizar y una variable que se desee categorizar. Estas variables deben
poseer unidades de medida “Ordinal” o “Nominal”, por lo que utilizar variables con medida de
Escala no tiene mayor sentido y no ofrecería resultados de los que se pueda extraer mucha
información.

Ejemplo Práctico:
2. Posteriormente se debe escoger las
variables que se desee utilizar. En este
Se utilizará la base de datos “BaseDatosC1a.sav” para categorizar la edad de los encuestados caso se utilizarán las variables: “Sexo”
de acuerdo al sexo de estos. Es decir, se buscará definir cuantas personas de cada grupo de y “Edad”.
edad corresponden a sexo masculino y cuantas al sexo femenino.
Se debe ubicar una de las variables en
la casilla “Filas” y la otra en la casilla
“Columnas”. Esta ubicación dependerá
de la forma en que al investigador
resulte más cómodo que se desplieguen
los análisis en la tabla de contingencia,
por lo que los resultados no variarán si
se ubica en otra dirección.

Para mejorar los resultados se


recomienda hacer clic en el botón:
“Casillas”

Página 27
Módulo Básico SPSS - Programa Jóvenes Profesionales
3. Dentro de las opciones para m o
strarenlas casillas, se
recomienda al investigador utilizar
porcentajes, ya que la tabla de
contingencia por si sola, muestra
únicamente las frecuencias de los
datos, lo que en ocasiones puede
resultar insuficiente.

Para mostrar los porcentajes de las


frecuencias en la tabla solamente se
debe marcar las casillas respectivas. En
este caso se seleccionó la opción
“Columna” pues se desea que los
porcentajes sean mostrados para cada Interpretación:
una de las columnas.
Como se puede observar en la tabla, dentro de los 16 encuestados del rango de 18 a 29 años,
Finalmente se debe hacer clic en el 75% corresponde a mujeres, mientras que el 25% corresponde a hombres. En el rango de 30
“Continuar” y posteriormente en “ a 49 años sucede lo contrario: El 72,7% de los encuestados son varones y el 27,3% son
Aceptar” para v i sualizar los mujeres, mientras que de los encuestados mayores de 50 años, el 66,7% corresponde a
resultados. personas del sexo femenino, mientras que el 33,3% corresponde a hombres.

Al igual que con cualquier resultado, SPSS muestra un resumen del procesamiento, en el que
se indica que se utilizaron 30 casos para el análisis y que estos corresponden al 100% de los
datos incluidos.

Página 28

También podría gustarte