Está en la página 1de 248

INTRODUCCION AL SPSS

SPSS es un poderoso paquete para el anlisis estadstico y la gestin de


datos. Fue diseado en un principio para las ciencias sociales en la dcada
de los 70s. Con el pasar del tiempo se observo que su aplicacin se
extenda a la mayora de las ramas de la ciencia y los negocios, por lo que
se fueron aadiendo nuevos mdulos para pruebas estadsticas
especializadas.

El objetivo de este Curso es orientarlos en el aprendizaje del manejo


operativo del paquete (Mdulo Base y Mdulo de Tablas); es decir,
capacitarlo para que usted pueda llevar a cabo anlisis tiles de sus datos
de forma prctica y sencilla mediante SPSS. La estructura temtica y los
grficos que se incluyen en el Curso estn basados en la versin 16.0 de
SPSS.

Introduccin al SPSS
Para ingresar al programa, tenemos dos opciones; la primera es mediante el
acceso directo ubicado en el Escritorio (Si lo hay) y la segunda es mediante
la rutaInicio.. Programas.. SPSS para Windows.. SPSS para Windows.

Aclaracin:
Los tipos de archivos que genera SPSS, los cuales son:

Archivos de Datos: son los archivos generados por el sistema (SPSS), en


los cuales se almacena la informacin (casos y variables) que se haya
creado en el editor o se haya importado de otras fuentes. Este tipo de
archivo se genera con la extensin (*.sav).
Archivos de resultados: son los archivos generados por el sistema, en los
cuales se plasman todos los resultados de los procesos que se han
realizado con el paquete (Tablas, Grficos, Estadsticos, etc). Este tipo de
archivo se identifica con la extensin (*.spo).
Archivos de sintaxis: este tipo de archivos contienen las lneas de cdigo o
palabras clave de cada uno de los procedimientos que se hayan realizado
con el paquete (Frecuencias, Grficos, etc.). Este tipo de archivo se
identifica con la extensin (*.sps).

Para continuar seleccionamos la opcin Abrir una fuente de datos


existente y sucesivamente hacemos clic en Aceptar, surgiendo la ventana
de exploracin de Windows [Fig.1-18]. A travs de esta ventana, podemos
ubicar de forma rpida y sencilla un archivo dentro del ordenador o la red.
Por defecto la ventana de exploracin se ubica en la carpeta SPSS
ubicada en la unidad [C:]; en esta carpeta se encuentran todos los archivos
de muestra que se incluyen con el programa, los cuales son nombrados en
la mayora de los tutoriales del paquete.
En nuestro caso vamos a ubicar el archivo Cap1.sav, el cual se
encuentra en la carpeta Captulo 1 del CD adjunto al libro. En la ventana
localizamos la carpeta Captulo 1 y hacemos doble clic sobre ella de manera
que aparezca en la ventana el archivo Cap1 [Fig.1-19]. Para finalizar
seleccionamos el archivo y sucesivamente hacemos clic en Abrir, de
manera que la informacin contenida en el archivo es representada en
el Editor de datos [Fig.1-20].
Esta es la ventana principal del programa, en ella se encuentra la
mayora de los procedimientos que se pueden realizar con el paquete, as
como los accesos directos a las opciones de los diferentes mdulos.
Adems esta es la nica ventana del programa en la que podemos apreciar
la informacin (Casos y Variables) en su estado original (Desagrupado). El
Editor de datos esta compuesto por cinco secciones, cada una de las cuales
nos ofrece opciones e informacin diferente. Los componentes del editor de
datos son:

Barra de Mens
Como la mayora de los programas basados en el sistema
operativo Windows, el Editor de datos de SPSS cuenta con una barra de
mens desplegables, en donde se encuentran las diferentes opciones,
procedimientos y aplicaciones que se pueden ejecutar con el programa. En
SPSS se cuenta con diez diferentes mens desplegables [Fig.1-21]; dentro
de los que encontramos Archivo, Edicin, Ver, Datos, Transformar, Analizar,
Grficos, Utilidades, Ventana y Ayuda (?).

Figuras 1-17

Las opciones y procedimientos de los mens Archivo, Edicin y Ver, estn


orientados a las propiedades de Editor de datos. Las opciones y
procedimientos de los mens Datos y Transformar se enfocan a las
propiedades y modificacin de los datos (Casos o variables) del archivo que
se encuentre abierto. Los procedimientos de los
mens Analizar y Grficos se encaminan en la descripcin y anlisis de los
datos a travs de pruebas estadsticas o grficos representativos. El
men Utilidades en cambio se orienta a la generacin y ejecucin de los
procesos automticos; es decir, sus opciones y procedimientos se emplean
en la utilidad de produccin. Por ltimo aparecen los
mens Ventana y Ayuda (?).
Barra de Herramientas
En esta barra se encuentran los botones de acceso directo a los
procedimientos ms comnmente utilizados del programa. Los
procedimientos de esta barra pueden ser modificados por el usuario de
acuerdo a su criterio y necesidades; permitindole personalizar su
contenido. Por defecto el programa incluye dentro de la barra de
herramientas los procedimientos:

Abrir Archivo ( ), Guardar archivo ( ) e Imprimir ( ): Al


seleccionar (Hacer clic) el botn Abrir archivo, aparece la ventana de
exploracin de Windows por medio de la cual podemos ubicar un archivo en
el ordenador (Slo admite algunos tipos de formato [Ver Tipos de archivo en
la ventana de exploracin]). Al seleccionar Guardar archivo, los cambios
que se hayan realizado en el editor de datos al archivo activo (Abierto), son
guardados. Al seleccionar Imprimir, se abre la ventana de impresin de
Windows; a travs de esta opcin se imprime el contenido del archivo de
datos; es decir, los casos y las variables. Esta opcin slo es til si el
nmero de datos es muy pequeo.

Recuperar cuadro de dilogo ( ): Este botn nos permite acceder de


forma rpida a los ltimos procedimientos que hayamos efectuado en
SPSS; es decir, nos muestra los diferentes cuadros de dilogo (ventanas)
que se hayan ejecutado (Empleado) con anterioridad en el programa,
como frecuencias, grficos, tablas, etc. Al seleccionar esta opcin se
despliega una lista con el nombre de los procedimientos que se han
realizado [Fig.1-22]; si elegimos alguna de ellas (Hacer clic), aparecer el
cuadro de dilogo del procedimiento.

Figuras 1-22

Deshacer ( ) y Rehacer ( ): Este par de iconos tambin son comunes


en la mayora de los programas de Windows, con la diferencia que en
SPSS, slo nos permite deshacer o rehacer la ltima accin y solamente
una. Para que se activen estos botones, se debe realizar alguna operacin
en el Editor de datos (Cortar, copiar, eliminar, etc.).

Ir a grfico ( ): Este icono nos permite ir rpidamente al ltimo grfico


realizado durante la sesin actual de SPSS; al seleccionarlo aparece la
ventana deresultados y nos ensea el grfico.

Ir a caso ( ): Como su nombre lo indica nos permite ir a un caso


especfico dentro del archivo de datos activo; es decir, nos ubica en la
posicin donde se encuentra el caso. Al seleccionar esta opcin aparece la
ventana correspondiente [Fig.1-23]; en este cuadro debemos ingresar el
nmero del caso que nos interesa ubicar.

Figuras 1-23

Variables ( ): a travs de esta opcin podemos obtener la informacin


(Propiedades) que se haya definido para cada una de las variables del
archivo activo. Cuando seleccionamos este icono se abre un nuevo cuadro
de dilogo [Fig. 1-24], en el cual nos muestra toda la informacin de cada
una de las variables (el nombre, la etiqueta, si hay o no valores perdidos, el
nivel de medida, los valores y las etiquetas de cada valor).

Figura 1-24

Si se desea observar la informacin de otra variable, basta con sealarla en


la lista de variables (Hacer clic) y la informacin de ella aparece dentro de la
casilla del cuadro de dilogo. Este botn es de bastante utilidad cuando se
desconoce el contenido de los datos o sencillamente se nos olvida el
contenido y estamos realizando anlisis con los procedimientos del
programa.

Buscar ( ): A travs de este icono podemos ubicar un valor dentro de


una variable; es decir, nos permite encontrar un nmero o una combinacin
de caracteres dentro de los registros de una variable. Dado que
generalmente se utilizan nmeros para representar las categoras de las
variables (Por ejemplo: hombre = 0 y mujer =1) y las bases de datos poseen
mltiples variables, sera ilgico esperar que la bsqueda se realice en todo
el archivo.

Al seleccionar el procedimiento Buscar, aparece un nuevo cuadro de


dilogo [Fig.1-25]; para identificar la variable en la que se realizar la
bsqueda, el cuadro adiciona en la parte superior la frase Buscar datos en
la variable *** (donde *** = nombre de la variable). Para seleccionar una
variable se debe hacer clic sobre ella directamente en el editor de datos, de
manera que el nombre de la variable en la frase cambie por el de la variable
seleccionada.
Figuras 1-25

Si nos fijamos en el cuadro de dilogo Buscar datos, notaremos que


aparece en la parte inferior del cuadro la opcin Coincidir maysculas y
minsculas; esta opcin nos permite especificarle al programa que realice la
bsqueda de forma ms exacta; desde luego esta opcin slo es aplicable a
las variables que tengan caracteres alfanumricos (Letras). Por ltimo
encontramos el botn Buscar siguiente; a travs de este botn podemos
pasar de un caso o registro encontrado, que coincida con las condiciones de
bsqueda, al siguiente.

Insertar caso ( ) e Insertar variable ( ): Como su nombre lo indica,


estas dos opciones nos permiten ingresar un nuevo Caso o Variable. Al
seleccionar la opcin Ingresar caso, el programa nos permite ingresar los
valores del caso para cada una de las variables del archivo. Si por el
contrario seleccionamos la opcin Insertar variable, el programa nos
permite ingresar una nueva variable o pregunta para los casos del archivo
de datos activo.

Segmentar archivo ( ): Este icono nos permite dividir nuestra base de


datos(Archivo activo) en distintos grupos de acuerdo a la variable que
utilicemos para la segmentacin. Al seleccionar esta opcin, se abre un
nuevo cuadro de dilogo [Fig.1-26]; en el que encontramos tres diferentes
opciones de segmentacin. La primera opcin del cuadro es Analizar todos
los casos, no crear los grupos; esta opcin nos permite trabajar con todos
los casos de la base y calcular los resultadosde los estadsticos empleando
la totalidad de los casos u observaciones.
La segunda opcin corresponde a Comparar los grupos; esta opcin nos
permite comparar los resultados de los procedimientos que se realicen con
el programa para las categoras de la variable de agrupacin; para realizar
la comparacin el programa realiza los clculos solamente con los datos de
cada categora y presenta los resultados de forma comparativa; es decir
ubica de forma jerrquica losresultados de cada categora (por ejemplo:
tabla categora 1, tabla categora 2, grfico categora 1, grfico categora 2,
estadstico categora 1, estadstico categora 2).

La tercera opcin corresponde a Organizar los resultados por grupos; esta


opcin es muy similar a la opcin anterior, con la diferencia que
los resultados de los procedimientos que se realicen con el programa se
representan en forma organizada (Por ejemplo: Tabla Cat1, Grfico Cat1,
Estadstico Cat1, Tabla Cat2, Grfico Cat2, Estadstico Cat2). Esta opcin
es bastante til si nosotros deseamos hacer un anlisis separado de la
muestra por algn tipo de rangos, como por ejemplo el gnero, la regin,
la fecha, etc.

Figuras 1-26

Para realizar la segmentacin de archivo debemos seleccionar una de las


dos ltimas opciones, de manera que se active la casilla Grupos basados
en; una vez se activa se ingresa en ella la variable o las variables que
deseamos utilizar como rango y finalmente hacemos clic en Aceptar.
Despus de segmentar el archivo, cada procedimiento (tablas, grficos o
estadsticos) que se realice con el programa, mostrar los resultados de
acuerdo a la segmentacin. En captulos posteriores emplearemos
este procedimiento para comprender los resultados que ocasiona.

Ponderar ( ): A travs de esta opcin, podemos asignarle un peso o


valor diferente a cada uno de los casos; es decir, darle mayor importancia a
unos valores de registro que a otros, esto se hace con el fin de poder sacar
algn resultado representativo de la poblacin y no de la muestra. Para
poder realizar este procedimiento, es necesario tener una variable de
ponderacin en la cual se encuentran los valores (Pesos) de cada registro;
en captulos posteriores emplearemos esta opcin para comprender
los resultados que ocasiona.

Seleccionar casos ( ): A travs de esta opcin, podemos seleccionar


solamente los casos que cumplan con los criterios que el investigador
imponga; por ejemplo, las personas del gnero femenino. A su vez,
este procedimiento nos brinda la oportunidad de pedirle al programa que
tome un fragmento de los casos de forma aleatoria. Al activar la seleccin
de casos el programa realiza los clculos de los procedimientos slo con los
casos que hayan sido seleccionados.

Etiquetas de valor ( ): Esta opcin nos permite observar en el editor de


datos, los valores de los datos o la categora a la que corresponde.
Al activar esta opcin aparecen en el editor de datos las categoras
(palabras) de cada una de las variables [Fig.1-27]. Si por el contrario
desactivamos esta opcin, aparecen en el editor de datos los nmeros
(Valores) de cada variable [Fig.1-28]. La utilidad de esta opcin radica en la
capacidad de darnos informacin sobre los datos que contiene cada una de
las variables categricas.

Figuras 1-27

Usar conjuntos ( ): Este procedimiento nos permite generar o utilizar


conjuntos de variables, para restringir el nmero de variables mostradas en
las listas de origen de los cuadros de dilogo. Los conjuntos de variables
pequeos hacen que la bsqueda y la seleccin de variables para los
anlisis sea ms fcil y pueden incluso mejorar el rendimiento. Si el archivo
de datos contiene un elevado nmero de variables y los cuadros de dilogo
se abren con lentitud, es necesario restringirlas listas de origen de los
cuadros con subconjuntos de variables ms pequeos, lo que reduce la
cantidad de tiempo empleado en abrirlos.

Personalizar la Barra de Herramientas de


SPSS
Los procedimientos que se incluyen en la barra de herramientas pueden ser
modificados, extrayendo o ingresando los procedimientos que deseemos.
Para realizar la personalizacin de la barra de herramientas, debemos
ubicar el puntero del ratn sobre la barra de herramientas y
hacer clic derecho sobre ella de manera que aparezca el men desplegable
[Fig.1-29].

Figuras 1-29

Una vez aparece el men, seleccionamos la opcin personalizar con lo que


aparece el cuadro de dilogo correspondiente [Fig.1-30]. A travs de este
cuadro podemos personalizar las barras de herramientas existentes e incluso
crear nuevas barras. En las barras de herramientas se puede incluir
cualquier procedimientodisponible, o cualquier accin del men.

Para personalizar una barra de herramientas, debemos seleccionar en


la lista de Categoras (Mens y opciones), la categora en que se encuentre
el procedimientoque deseamos incluir. Una vez se selecciona la Categora, se
actualizan en la listade elementos los procedimientos que se incluyen dentro de
ella. Para seleccionar elprocedimiento basta con hacer clic sobre el y
manteniendo oprimido el botn del ratn, arrastrarlo hasta la ubicacin de la
barra donde deseamos ingresarlo. Al soltar el botn del ratn, aparece en la
barra el icono representativo delprocedimiento seleccionado.

Figuras 1-30

A manera de ejemplo ingresaremos en la barra


de herramientas el procedimientoFrecuencias. Para realizarlo debemos
seleccionar en la lista de categoras la opcin Analizar, de manera que
aparezca en la lista de elementos los procedimientos tpicos de este men. Una
vez se actualiza el contenido, nos dirigimos a la barra de desplazamiento
horizontal ubicada en la parte inferior del cuadro (Personalizacin de la barra
Editor de datos) y la arrastramos hacia la derecha de manera que aparezca el
extremo derecho de la barra de herramientas.

Despus de aparecer el extremo de la barra, ubicamos en la lista de elementos


la opcin Separador ( ) en la parte superior de la lista de elementos; lo
seleccionamos (Hacer clic) y manteniendo el botn del ratn oprimido lo
arrastramos hacia el costado derecho de la barra del editor de datos, en donde
lo soltamos. Una vez se suelta el separador, aparece en la barra un segmento
sin icono; el objetivo de ingresar este separador, consiste en crear un espacio
entre los botones usar conjuntos y Frecuencias que vamos a infiltrar. Despus
de ingresar el separador, introducimos el procedimiento Frecuencias,
ubicndolo en la lista de elementos y llevndolo hasta el costado derecho de la
barra de herramientas, en donde soltamos el botn de ratn y aparece el
botn 123 [Fig.1-31].

Figuras 1-31

Una vez se ingresa el procedimiento a la barra de herramientas,


hacemos clic enAceptar con lo que se cierra el cuadro de dilogo y volvemos al
editor de datos. Si nos fijamos en la barra de herramientas del editor de datos,
notaremos que ahora aparece en ella el icono ( ), el cual representa
el procedimiento Frecuencias; si hacemos clic en l se abrir el cuadro de
dilogo correspondiente. Este mismoprocedimiento debe ser empleado
para ingresar nuevas aplicaciones a la barra deherramientas.

Barra de Posicin
La barra de posicin esta ubicada debajo de la barra de herramientas en el
editor de datos y nos permite identificar de forma rpida y sencilla el nmero
del caso (Fila), la variable (Columna) y el valor de la casilla de registro que
hemos seleccionado [Fig.1-32]. Para activar la barra, debemos hacer clic sobre
cualquiera de las casillas del editor de datos, con lo que aparecer de forma
automtica la informacin de la casilla. La utilidad de esta casilla se pone en
evidencia cuando trabajamos con archivos que cuenten con un nmero elevado
de registros.

Figura 1-32

Vistas del Editor de Datos de SPSS


El editor de datos cuenta con dos diferentes tipos de vistas (Datos y
Variables), a travs de las cuales podemos modificar o definir parmetros
especficos de la informacin contenida en el archivo. La primera de estas
vistas corresponde a la Vista de datos [Fig.1-33]. Esta es la vista que
aparece por defecto en el editor de datos y mediante ella podemos ingresar,
modificar o eliminar los casos y registros (valores) del archivo. La estructura
de la vista de datos esta diseada de manera, que las variables (Preguntas)
se ubiquen en las columnas y los casos, registros u observaciones se
ubiquen en las filas.

Figuras 1-33

A travs de la Vista de datos podemos observar, modificar o eliminar cada uno


de los valores de los casos que componen el archivo de datos. Adems cuando
creamos un archivo nuevo, es en esta vista donde se ingresan los datos; para
realizarlo debemos ingresar la informacin en cada una de las casillas. Es
necesario resaltar que se denomina Caso a las repuestas que un individuo
proporciona a la totalidad de las preguntas o variables del archivo.

La segunda vista del editor de datos corresponde a la Vista de Variables [Fig.1-


34]. A travs de la vista de variables se definen los parmetros informativos de
laspreguntas o variables del archivo; esta vista es sin ninguna duda la parte
ms importante del paquete, ya que de la correcta definicin de nuestras
variables depende la efectividad de nuestro anlisis y los procedimientos que
podamos realizar con ellas. Para seleccionar esta vista basta con hacer clic
sobre la pestaaVista de variables ubicada en la parte inferior de la ventana.
Figuras 1-34

Al seleccionar la vista de variables, aparece en la parte superior del rea


de datos una serie de propiedades preestablecidas por el programa entre las
que encontramos Nombre, Tipo, Anchura, Decimales, Etiqueta, Valores,
Perdidos, Columna, Alineacin y Medida. Cada una de estas propiedades tiene
un propsito especfico y es necesario antes de generar algn tipo de anlisis,
comprobar que estn correctamente diligenciados cada uno de los campos. Si
nos fijamos en las casillas de la vista notaremos que ahora las filas
corresponden a cada una de las variables de nuestra base o archivo; esto se
debe a que en la vista de variables la estructura esta diseada para
que las Propiedades de las variables se ubiquen en las columnas y
las variables se ubiquen en las filas.

Es importante hacer notar la diferencia estructural entre la Vista de Variables y


laVista de Datos [Fig.1-35]; esta diferencia se produce debido a que en
la Vista de variables definimos las caractersticas de las variables; es decir, sus
propiedades. Lo nico que se realiza en esta vista, es ingresar informacin
complementaria de las variables, la cual determina los procedimientos que
pueden ser empleados en el anlisis, de acuerdo a las caractersticas de
la variable. Mientras la Vista de datosnos permite ingresar, modificar o eliminar
los datos (registros o variables) del archivo.

Figuras 1-35

Si nos fijamos en las estructuras de las vistas del Editor de datos, notaremos
que para la vista de datos, las variables se ubican en las columnas y los casos
o registros se ubican en las filas, mientras que para la vista de variables, las
propiedades (Definicin) se ubican en las columnas y las variables se ubican
en las filas. Una vez aclaradas las diferencias estructurales de las vistas,
continuaremos describiendo cada una de las propiedades de las variables, las
cuales determinan en gran medida los diferentes procedimientos que se
pueden realizar con los datos.

Propiedades de las Variables en SPSS


Las variables en SPSS cuentan con una serie de propiedades que deben ser
definidas por el investigador o usuario antes de realizar cualquier tipo de
anlisis con ella. De la correcta definicin de las propiedades, depende en gran
medida la calidad de los anlisis que se realicen y por lo tanto la veracidad de
los resultados o conclusiones que se generen. SPSS ha estipulado diez
propiedades informativas de las variables entre las que encontramos:

I. Nombre:
Este parmetro nos permite identificar y diferenciar las variables que componen
el archivo; para cada una de las variables se debe definir un nombre especfico.
El programa establece una serie de normas para los nombres de variables,
entre las que encontramos:

Cada nombre de variable debe ser nico; no se permiten duplicados.


La longitud del nombre no debe exceder los 64 bytes. Sesenta y cuatro bytes
suelen equivaler a 64 caracteres en idiomas de un slo byte (por ejemplo, ingls,
francs, alemn, espaol, italiano, hebreo, ruso, griego, rabe, tailands) y 32
caracteres en los idiomas de dos bytes (por ejemplo, japons, chino, coreano).
El nombre debe comenzar por una letra. Los dems caracteres pueden ser
letras, dgitos, puntos o los smbolos @, #, _ o $.
Los nombres de variable no pueden terminar en punto.
Se deben evitar los nombres de variable que terminan con subrayado (para evitar
conflictos con las variables creadas automticamente por algunos
procedimientos).
No se pueden utilizar espacios en blanco ni caracteres especiales (por ejemplo, !,
?, ' y *).
Las palabras reservadas (ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO,
WITH) no se pueden utilizar como nombres de variable.
Los nombres de variable se pueden definir combinando de cualquier manera
caracteres en maysculas y en minsculas, esta distincin entre maysculas y
minsculas se conserva en lo que se refiere a la visualizacin.

Para las versiones anteriores de SPSS (11.5, 11.0, 10.0, etc.) la longitud de las
variables es de slo ocho Bytes, lo cual generalmente no es suficiente para
identificar una variable, por lo que es recomendable utilizar las tres primeras
letras de cada palabra de la frase; es decir,

Estado Civil = estciv


Nivel de confianza = nivdecon
No necesariamente se debe seguir esta regla, lo realmente importante es que
el nombre de la variable le permita identificar al usuario o investigador, el
contenido a que se hace referencia; es decir, permitirle al usuario hacerse una
idea del tema que abarca los datos de esa variable.

II. Tipo:
La propiedad Tipo, nos permite especificarle al programa la naturaleza de los
datos que se incluyen dentro de la variable; es decir, nos permite definir la
forma y el significado de los caracteres que se encuentran en los registros de la
variable. SPSS nos permite elegir entre ocho diferentes tipos de variables para
representar Nmeros (Magnitudes), Fechas (Tiempo), Monedas (Dinero) y
Letras (Cadena). Desde luego es aconsejable trabajar las variables de forma
numrica ya que el anlisis estadstico es una ciencia matemtica y para su
correcto funcionamiento es necesario realizar las operaciones con nmeros; ya
que en algunos casos no es posible tener los datos de forma numrica, el
paquete nos permite trabajarlos como una cadena de caracteres (Letras y
Nmeros).

Para definir el Tipo, debemos hacer clic en la casilla de la variable de inters,


de manera que aparezca en el costado derecho de la casilla un pequeo
cuadrado con puntos suspensivos ( ). Al seleccionar el botn (Hacer clic),
aparece el cuadro de dilogo Tipo de variable [Fig.1-36], en donde aparecen
los diferentes Tipos devariable que se pueden elegir para la variable
seleccionada.

Figura 1-36

Numrico: Se emplea en una variable numrica cuyos valores representan


magnitudes o cantidades y se asocian de forma estndar; es decir, asume la
notacin por defecto de Windows para la separacin decimal
(Enteros (,)Decimales) 1000,00; este suele ser el tipo mas usado.

Coma y/o Punto: Estos dos tipos de variables se emplean en una variable
numrica cuyos valores representan magnitudes o cantidades. Al seleccionar la
opcin Coma los valores se asocian con comas que delimitan cada tres
posiciones y con el punto como delimitador decimal 1,000.00. Cuando se
selecciona el Punto los valores se asocian con puntos que delimitan cada tres
posiciones y con la coma como delimitador decimal 1.000,00.

Notacin cientfica: Se utiliza en una variable numrica cuyos valores son


demasiado grandes o pequeos, por lo cual se emplea un exponente con signo
que representa una potencia en base diez. 1000.000.00 = 1.0E+6
0.000001 =1.0E(-6). SPSS nos permite representarlo de varias formas como
1000000, 1.0E6, 1.0D6, 1.0E+6, 1.0+6. La notacin es til cuando manejamos
cifras extremas de lo contrario es mejor manejarlo de forma numrica.

Anchura, Decimales y Etiquetas en SPSS


Fecha: Este tipo de variable se emplea cuando los valores de
la variablerepresentan fechas de calendario u horas de reloj; al seleccionarla
aparece en el cuadro de dilogo una casilla con el listado de los
diferentes formatos que el programa reconoce [Fig.1-37]. Para elegir alguno de
ellos basta con hacer clicsobre el formato y sucesivamente en Aceptar.

Figura 1-37

Dlar: se emplea en una variable numrica cuyos valores representan


sumas de dinero en dlares. Al seleccionar este tipo de variable aparece en
el cuadro de dilogo un listado de formatos monetarios [Fig.1-38], en donde
debemos seleccionar el formato que ms se acomode a los datos.

Figuras 1-38 y 1-39


Moneda personalizada: Este tipo de variable se emplea cuando los valores
de una variable representan sumas de dinero diferentes al dlar (Pesos,
pesetas, Euros, etc.); al seleccionar esta opcin aparece un
nuevo listado [Fig.1-39], en el cual debemos seleccionar uno de
los formatos existentes. Estos formatos no
representan monedas especificas, si no que por el contrario el programa
asume que la moneda es de origen distinto al dlar. La diferencia con el tipo
dlar es que nos permite trabajar con cinco (5) diferentes tipos de moneda.

Cadena: Este tipo de variable se emplea cuando los valores no son


numricos o sencillamente no representan magnitudes o cantidades; estas
variables no son utilizadas en los clculos de los estadsticos. Las variables
de cadena pueden contener cualquier tipo de caracteres siempre que no
exceda la longitud mxima de 255; las maysculas y las minsculas se
consideran diferentes ya que el programa trabaja bajo el cdigo ASCII. A
este tipo de variables, tambin se le suele denominar
como variable alfanumrica. Para definir alguno de los tipos de variable,
basta con hacer clic sobre la opcin que se desee y sucesivamente
hacer clic en el botn Aceptar, con lo que se cierra la ventana y el tipo
elegido aparece en la casilla seleccionada.

III. Anchura:
Por medio de esta propiedad podemos definir el mximo de dgitos que
contienen los registros de una variable; para el clculo del ancho se
incluyen los dgitos enteros y los decimales. Por ejemplo;

Anchura 5 = xxx.xx x,xxx.x xx,xxx donde x representa un nmero


aleatorio.
No debemos cometer el error de pensar que una vez establecida la
anchura, ya no podremos encontrar una cifra con mayor cantidad de
nmeros dentro de los registros. La opcin Anchura se emplea para darle
una idea al investigador, de las cifras que encontrar cuando le pida al
paquete informacin de las variables, es decir, no restringe la cantidad de
nmeros sino que es un parmetro informativo, el cual le brinda a la
persona que opere el programa una idea de los rangos mximos que puede
tomar esta variable, pero no impide que se ingresen valores que
sobrepasen esta longitud.

IV. Decimales
A travs de este parmetro se define el nmero de dgitos decimales que
pueden contener los registros de la variable. Las cifras que superen esta
longitud sern aproximadas por el programa. Cuando una cifra supera la
longitud, el programa aproxima hacia arriba los dgitos que sobrepasen la
longitud si el valor del ltimo de ellos es igual o mayor que cinco, de lo
contrario (menor que 5) se aproxima hacia abajo; es decir:
1.07X si X < 5 entonces se aproxima a 0 es decir = 1.07
1.07X si X => 5 entonces se aproxima a 10 es decir = 1.08

Las propiedades Anchura y Decimales pueden ser editadas directamente


desde la ventana de Tipo de variable cuando se eligen los tipos numricos
de variables Numrica, Coma, Punto, Notacin cientfica, Dlar o Moneda
personalizada [Fig.1-40], ya que al seleccionar estas opciones se habilita en
el cuadro de dilogo las casillas Anchura y Decimales.

Figuara 1-40

Hay que notar que cuando seleccionamos los Tipos de variables como
la Fecha yCadena estas propiedades se desactivan; esto se debe a que
para el tipo de formato Fecha el programa ha predefinido estos parmetros
y no podemos alterarlo, la nica opcin que tenemos es escoger otro
formato de fecha; mientras que para el tipo cadena no se puede tener
nmeros decimales.

V. Etiqueta
Dado que generalmente los sesenta y cuatro (64) caracteres del nombre
(Versiones anteriores ocho [8]) y las normas que se deben cumplir, no
permiten describir de forma clara la variable y el contenido de ella; SPSS
nos brinda la posibilidad de utilizar una etiqueta por medio de la cual
podemos describir lavariable mediante la utilizacin de un mximo de 255
caracteres.

El uso de la etiqueta es bastante til para facilitar la interpretacin de


los resultados(Tablas, Grficos o estadsticos), para las personas que no
han participado en la generacin de los procedimientos y desconocen el
significado del nombre de lavariable. El uso de la etiqueta es opcional, el
programa en caso de no existir una etiqueta utiliza el nombre de
la variable para generar los resultados. Para saber si una variable tiene
estipulada una etiqueta debemos ubicar el cursor del ratn sobre el nombre
de la variable en la vista de datos, de manera que aparezca una leyenda
informativa. Para comprender el valor practico del uso de etiquetas,
debemos observar las tablas de la figura [1-41].
Figura 1-41

Estas tablas contienen la frecuencia y el porcentaje de las categoras de


la variableEstado civil (Casado y Soltero); la primera tabla cuenta con
etiquetas para el nombre de la variable y para las categoras de la variable,
mientras que la segunda tabla no cuenta con etiquetas. Si nos fijamos en la
tablas notaremos que para interpretar la segunda tabla encontramos
dificultades ya que no podemos determinar que categora representan los
nmeros cero (0) y uno (1). Esta misma dificultad puede presentarse
cuando nosotros realizamos un anlisis de datos y entregamos
los resultados a una persona que no haya participado en los
procedimientos; para evitar estos inconvenientes se sugiere definir las
etiquetas devariable y de valores.

Antes de definir la propiedad Valores debemos ver primero


las propiedadesPerdidos y Medida, ya que la utilizacin de la etiquetas de
valor est determinado por estos dos parmetros y en este momento no
seria muy clara su definicin.

Valores perdidos y Etiquetas de valor en


SPSS

V. Valores perdidos
Los valores perdidos son razones por las cuales no obtenemos
una respuesta coherente de algn entrevistado; es decir, es una razn que
nos indica la causa por la que no me aporta informacin el entrevistado.
Dentro de los valores perdidos podemos encontrar:

No sabe
No responde o se niega a responder
No aplica o sencillamente la pregunta no lo afecta EJ: preguntarle a una persona
soltera la edad a la que se caso por primera vez, si no se ha casado nunca
esta pregunta no lo afecta.

Debemos tener claro que los valores perdidos son razones y no errores,
generalmente tendemos a confundir un valor perdido con un valor que no esta
dentro de nuestro rango. Por ejemplo, si en la variable gnero (sexo), tenemos
losvalores (1 = mujeres y 2 = hombres) y despus de revisar el archivo nos
damos cuenta que tenemos en algunos registros el valor 3, generalmente
cometemos el error de pensar que este es un valor perdido, pero no lo es, este
tipo de valores los debemos considerar como errores ya sea de digitacin o de
captura y la forma de corregirlos es ir hasta la fuente (entrevistas) y determinar
a que grupo perteneca el individuo. Si no podemos determinar el grupo y
los valores son muy pocos es recomendable prescindir de estos casos.

SPSS maneja dos tipos de valores perdidos; el primero es perdido por el


sistema, el cual se identifica por la ausencia total de datos; es decir, casillas
vacas y el segundo corresponde a los datos perdidos definidos por el usuario
(No sabe, Noresponde o No aplica). El programa detecta automticamente
los valores perdidos por el sistema y los omite, mientras que
los valores perdidos por el usuario deben ser definidos al programa o de lo
contrario los clculos se realizarn contando con estos valores, lo cual puede
afectar severamente los resultados.

Figuras 1-42

Para definir un valor perdido por el usuario debemos activar la casilla


correspondiente a Perdidos de la variable de inters, de manera que aparezca
al costado derecho de la casilla un cuadrado con puntos suspensivos ( ). Al
seleccionar el cuadrado (Hacer clic) aparece la ventana de Valores Perdidos
[Fig.1-42]. En este cuadro encontramos tres diferentes posibilidades. La
primera corresponde a No hay valores perdidos (Los clculos se realizan con la
totalidad de los registros). La segunda corresponde a Valores perdidos
discretos (son un mximo de tres valores perdidos en la variable; se puede
emplear los valores(nmeros) que se deseen.

Para este tipo de valores se recomienda que exista una distancia considerable
entre los valores representativos y los perdidos con el fin de facilitar su
identificacin). La tercera y ltima opcin corresponde a Rango ms un valor
discreto opcional (se utiliza cuando tenemos varios parmetros de valores
perdidos, los cuales se encuentran dentro de un rango. Para seleccionar esta
opcin es necesario que no existan valores representativos de grupos dentro
del rango de lo contrario sern omitidos de los clculos. Adems esta opcin
nos permite ingresar un valor discreto adicional). Para seleccionar cualquiera
de las opciones basta con hacer clic sobre la opcin de manera que aparezca
en la casilla de activacin ( ) un punto negro y sucesivamente ingresar
los valores.

VII. Columnas y Alineacin


Estos dos parmetros son netamente de formato (es decir de presentacin) y
sus efectos son apreciables nicamente en la vista de datos. La primera
propiedad (columnas) nos indica el ancho de la columna, mientras que la
segunda (Alineacin) determina la alineacin de los datos dentro de la casilla.
El parmetro columna, al igual que en una hoja de clculo, podemos alterarlo
de forma directa en la vista de datos colocando el cursor al lado de la columna
hasta que aparezca el indicador, hacemos clic y lo sostenemos arrastrando
hasta obtener el ancho deseado.

VIII. Medidas
Este es el parmetro ms importante de las variables, de su definicin depende
el tipo de anlisis que podemos realizar con el programa. Dentro de la
estadstica se han catalogado cuatro diferentes escalas de medida, pero para
SPSS estas escalas se resumen en slo tres:

Nominal: son variables numricas cuyos valores (Nmeros) indican una


categora de pertenencia. Para este tipo de medida, las categoras no cuentan
con un orden lgico que nos permita establecer una comparacin de superioridad
entre ellas. Un ejemplo de variable nominal puede ser el gnero, la raza, el
estado civil, etc.
Ordinal: son variables numricas cuyos valores indican una categora de
pertenencia y a su vez las categoras poseen un orden lgico que nos indica una
superioridad o prelacin. Un ejemplo de variable ordinal puede ser el nivel de
ingresos, categora del vehculo, nivel educativo, etc.
Escala: son variables numricas cuyos valores representan una magnitud o
cantidad y no una categora; los valores de este tipo de medida pueden ser
empleados en operaciones aritmticas como la suma, la resta, la multiplicacin y
la divisin ya que los intervalos (Distancia entre los nmeros) cuentan con la
misma longitud. Un ejemplo de variable de escala puede ser la edad, las ventas,
la distancia en metros, la altura, etc.

IX. Valores
Los valores o Etiquetas de valor nos permiten generar una leyenda que facilite
la interpretacin de los nmeros representativos de cada categora de una
variable, ya sea en los resultados o en la vista de datos. Debido a que se
utilizan nmeros para representar cada categora es necesario crear
una pequea leyenda que nos permita ver en letras la categora a la que
corresponde cada nmero. Las etiquetas de valor no pueden exceder los 60
caracteres y se deben emplear solamente si se cumplen los siguientes
requisitos:

La variable es categrica, es decir Nominal u Ordinal.


Se tienen valores perdidos por el usuario.
Para definir las etiquetas de valor debemos activar la casilla de valor
correspondiente a la variable de inters de tal manera que aparezca al costado
derecho un cuadrado con puntos suspensivos en su interior. Al hacer clic sobre
el cuadrado aparece la ventana Etiquetas de valor [Fig.1-43]; en esta ventana
encontramos tres casillas.

Figura 1-43

La primera corresponde al Valor o nmero, en ella debemos digitar el nmero


al que deseamos dar la etiqueta. La segunda casilla corresponde a la Etiqueta
de valor, en ella digitamos la categora a la que corresponde ese valor (mximo
60 caracteres) y la tercera casilla corresponde a las etiquetas aadidas; es
decir, las categoras que ya se han definido. Para ingresar una etiqueta de
valor, debemos primero ingresar el valor en la casilla Valor, sucesivamente
ingresar la leyenda en la casilla Etiqueta y finalizar haciendo clic en el
botn Aadir, con lo que aparece en la casilla el nmero y la
leyenda correspondiente.

Si deseamos cambiar una etiqueta que ya haya sido aadida, debemos


seleccionarla en la casilla (hacer clic sobre ella), editar ya sea el nmero o la
etiqueta y hacer clic en Cambiar. Si por el contrario deseamos eliminarla,
debemos seleccionarla y hacer clic en Eliminar. Para finalizar basta con
hacer clic enAceptar, con lo que la ventana se cerrara y las etiquetas quedarn
definidas. Es necesario Aadir antes de Aceptar o de lo contrario se perder
cualquier operacin de Aadir o Cambiar pendiente.

REA DEL PROCESADOR


La ltima seccin del editor de datos corresponde al rea del procesador, la
cual esta ubicada en la parte inferior de la ventana. A travs de esta rea
podemos saber el estado del procesador de acuerdo al proceso que se este
realizando. Esta seccin es de bastante utilidad cuando le pedimos al programa
un procedimiento y se cuenta con un elevado nmero de registros; en algunos
casos la base es tan extensa que puede tardar bastante tiempo la ejecucin del
resultado, en estos casos generalmente se tiende a pensar que el programa se
bloqueo, antes de determinarlo es importante saber cual es el estado del
procesador ya que el retardo puede ser ocasionado por la extensin de los
datos. Adems, cuando la licencia caduca, en esta rea encontramos el
mensaje el procesador no esta disponible.
Generando tablas de frecuencia en SPSS
Adems de la ventana editor de datos, SPSS cuenta con otras ventanas como
la de Resultados o la de Sintaxis. Para conocer la ventana de resultados,
vamos a generar una tabla de frecuencias con las variables Gnero y Estado
civil. Para realizarlo debemos ir al men Analizar.. Estadsticos
descriptivos.. Frecuencias[Fig.1-44]. Al seleccionar la opcin frecuencias,
aparece el cuadro de dilogo correspondiente [Fig.1-45]. A travs de esta
ventana se deben definir las variables a las que queremos realizar la tabla de
frecuencias.

Figuras 1-44 y 1-45

Si observamos el listado de variables que aparece al costado izquierdo del


cuadro, notaremos que las variables estn por su etiqueta y no por el
nombre, esto es til si desconocemos el archivo y su contenido, pero si es
un archivo que hemos creado o su contenido nos es familiar, seria ms
aconsejable manejarlo por el nombre de las variables. Antes
de continuar vamos a ver como se puede cambiar la forma de representar
las variables en la lista. Para realizarlo es necesario cerrar por un momento
la ventana Frecuencias, luego volveremos a ella. Para cerrarla basta con
hacer clic en el botn cancelar ubicado al costado derecho del cuadro.

Una vez cerrada la ventana nos dispondremos a cambiar la forma de


representar las variables en la lista, para esto debemos ir al
men Edicin... opciones, al hacer clic en opciones se abre el cuadro de
dilogo correspondiente [Fig.1-46].

Figuras 1-46
En este cuadro se manejan todas las opciones del paquete. Podemos
observar que en la parte superior del cuadro hay una serie de pestaas;
cada una de ellas corresponde a un proceso especfico del paquete. Dentro
de estos procesos encontramos (General, Visor, Visor de borrador,
etiquetas de los resultados, grficos, interactivos, tablas pivote, datos,
moneda y procesos). Al seleccionar uno de ellos, el contenido de la ventana
cambiar y nos mostrar las opciones que cada pestaa maneja. Por el
momento nos concentraremos en la pestaa General, en ella
encontraremos la opcin listas de variables, en la parte superior izquierda.

Figura 1-47

Esta seccin nos permite manipular la forma como deseamos que se


representen las listas de variables, en nuestro caso deseamos que las listas
se determinen por el nombre de las variables y en orden alfabtico. Para
hacerlo debemos seleccionar
las opciones Mostrar nombres y Alfabtico haciendo clic en el circulo ( )
que se encuentra a la izquierda de ellas [Fig.1-47]. Despus de seleccionar
lasopciones, hacemos clic en Aplicar y sucesivamente en Aceptar, de
manera que se cierra la ventana.

Para comprobar el efecto realizado en las listas de variables, vamos


a continuarcon la realizacin de la tabla de frecuencias. Para esto
nuevamente abrimos la opcin frecuencias en el men Analizar...
Estadsticos descriptivos... Frecuencias; al seleccionar la opcin, aparece
nuevamente el cuadro de dilogo correspondiente [Fig.1-48]. Si nos fijamos
en el listado de variables, notaremos que ahora aparecen los nombres de
las variables y no la etiqueta.

Figura 1-48
Continuando con el ejemplo, debemos ubicar las variables Gnero y Estado
civil (Estciv) en la lista de variables e ingresarlas a la casilla de seleccin.
Para hacerlo, debemos resaltar la variable deseada (Gnero) en la lista y
sucesivamente hacer clic en el botn flecha, de manera que aparezca en la
casilla de seleccin. Una vez ingresamos las dos variables, hacemos clic en
el botn Aceptar, ejecutando lastablas de frecuencia y sus consecuencias
son presentadas en la ventana Visor deresultados. Las dems partes de la
ventana Frecuencias, sern explicadas a profundidad en los captulos
posteriores.

Visor de Resultados de SPSS


En esta ventana se representan de forma grfica todos los procedimientos
(Tablas, Grficos o Estadsticos) que se hayan ejecutado en el programa.
SPSS cuenta con dos tipos diferentes de Ventanas de resultados, el primero es
el Visor deResultados [Fig.1-49] donde se muestra de forma interactiva los
resultados de los procesos y los organiza en forma jerrquica de acuerdo con
el orden que se hayan realizado.

Figuras 1-49 y 1-50

Figuras 1-51

El visor de resultados esta dividido en tres partes [Fig.1-51]. La primera de ellas


corresponde al navegador de resultados; esta seccin nos permite explorar los
resultados que hemos obtenido a travs de los diferentes anlisis realizados.
La segunda seccin corresponde al visualizador de resultados en el cual
obtenemos la imagen de los resultados de los procedimientos (Tablas y
Grficos). La tercera seccin corresponde a las opciones de ventana, en la cual
encontramos los diferentes procedimientos de la ventana y algunos
del paquete.

Navegador de Resultados
A travs del navegador de resultados, podemos explorar todos los resultados
obtenidos mediante los distintos procedimientos del paquete, as como tambin
organizarlos de acuerdo a nuestro criterio o las necesidades del reporte. SPSS
ha estructurado el navegador de forma jerrquica, con el fin de establecer un
orden en los resultados. Para comprender la estructura bsica
del navegador de resultados debemos observar la figura [1-52].

Note como el programa ubica el resultado de cada procedimiento por separado


y dentro de cada uno de ellos se incluyen las diferentes propiedades con que
cuentan; entre las diferentes propiedades de los procedimientos encontramos
el Ttulo, las notas, los estadsticos, los descriptivos, etc. Es necesario resaltar
que en SPSS se denomina procedimiento a cualquier tipo de anlisis que
realicemos con el paquete; es decir, que consideraremos como procedimiento
la generacin defrecuencias, las tablas de contingencia, la generacin de
grficos, etc.

Figura 1-52

Para apreciar la estructura del navegador directamente en los resultados, se


anexa la figura [1-53], la cual corresponde a una de las presentaciones tpicas
delnavegador; en ella podemos observar que para este caso existen dos
procedimientos; el primero de ellos corresponde al anlisis de frecuencias y el
segundo a un anlisis explorar (estos procedimientos sern examinados con
mayor detenimiento en los captulos posteriores). Debajo de cada
procedimiento, aparece una serie de propiedades que nos permiten describir
de forma ms explicita el contenido y el objetivo del procedimiento. Las
propiedades varan de acuerdo al procedimiento elegido, pero hay dos que
estn presentes en todas las aplicaciones del paquete, correspondientes
al Ttulo y las notas.

Si nos fijamos en la parte inferior de la Figura [1-53], notaremos que algunos de


losresultados tienen en su izquierda un icono parecido a un libro cerrado y
otros a unlibro abierto, esto se debe a que el programa nos brinda la posibilidad
de ocultar o mostrar un resultado simplemente haciendo clic en el signo que se
encuentra a su izquierda ( ). Cuando el signo es positivo ( ), nos indica
que ese resultado esta oculto y si el signo es negativo ( ) nos indica que esta
desplegado o abierto. Nosotros podemos ocultar una propiedad o un proceso,
ya que su forma de ejecucin es exactamente igual.

Adems de las opciones anteriormente enunciadas, el navegador tambin nos


permite organizar los resultados a nuestro criterio o necesidades; para
realizarlo slo basta con seleccionar la propiedad o el procedimiento que
deseemos reubicar y arrastrarlo hasta la posicin que se desee. A travs del
curso utilizaremos constantemente esta ventana y podremos comprender de
una mejor manera su beneficio.

Visualizador de Resultados de SPSS


La segunda parte de la ventana Visor de Resultados corresponde
al visualizador de resultados, en ella se ven representados todos los resultados
de los procedimientos que se han realizado con el programa y a su vez, los
efectos de las opciones de ocultar o mostrar del navegador se hacen notorios
en esta seccin. Si se elige la opcin ocultar, los resultados del procedimiento
desaparecen del visualizador y slo volvern a presentarse hasta que se elija la
opcin mostrar en elnavegador [Fig.1-54]. En esta figura se incluye el estado
del visualizador antes y despus de seleccionar la opcin mostrar.

Figuras 1-54

Adicionalmente, en esta seccin es donde se puede acceder a la edicin de los


objetos (Tablas y Grficos). Para poder activar la edicin es necesario ubicar el
puntero del ratn sobre el objeto y hacer doble clic, con lo cual se abrir el
editor correspondiente al objeto seleccionado (Editor de tablas pivote o Editor
de Grficos).por el momento no profundizaremos en estos temas ya que no
tiene sentido hablar de la edicin de tablas o grficos sin antes mencionar la
forma de generarlos con SPSS.
Opciones de Ventana
La tercera seccin que compone la ventana Visor de resultados corresponde a
las opciones de ventana, en ella se encuentran la barra de mens, la barra
deherramientas y la barra de opciones del navegador; en estos componentes
encontramos las funciones que nos permiten realizar los diferentes
procedimientos de la ventana e incluso algunos procedimientos del paquete. Si
nos fijamos en la barra de mens, notaremos que los mens correspondientes
a Datos yTransformar han desaparecido y en su lugar se encuentran los
mens Insertar y Formato.

Este cambio se debe a que los mens Datos y Transformar slo contienen
opciones aplicables a los datos (Registros y variables) cuando se encuentran
desagrupados y por lo tanto deben ejecutarse en el editor de datos de SPSS.
De igual manera los mens Insertar y Formato slo contienen procedimientos
que slo pueden ser ejecutados en el visor de resultados ya que estn
orientados a los resultados.

Dentro del men Insertar [Fig.1-55], se encuentran los procedimientos Salto de


pgina, Eliminar salto de pgina, Nuevo encabezado, Nuevo ttulo, Nuevo ttulo
de pgina, Nuevo texto, Grfico 2-D interactivo, Grfico 3-D interactivo, Grfico
antiguo, Nuevo mapa, Archivo de texto y Objeto. En el men Formato [Fig.1-
56], por el contrario encontramos slo tres opciones correspondientes Alinear a
la derecha, Centrar y Alinear a la izquierda, las cuales se utilizan de la misma
forma que en el editor de datos.

Figuras 1-55
Figura 1-56

Ahora, si nos fijamos en la barra de herramientas de


la ventana visor de resultados[Fig.1-57], notaremos que conserva algunos de
los procedimientos que encontramos en el editor de datos y slo incluye dos
nuevos procedimientos correspondientes a Seleccionar ltimos resultados y
Designar ventana. Desde luego estos procedimientos slo son aplicables para
la ventana de resultados.

Figura 1-57

Seleccionar ltimos resultados ( ): Como su nombre lo indica, nos permite


seleccionar los resultados del ltimo procedimiento ejecutado. Al seleccionar esta
opcin, en el visualizador aparecen las tablas o grficos correspondientes al
ltimo procedimiento. Es de bastante utilidad cuando tenemos un nmero
considerable de resultados.
Designar ventana ( ): Este icono se utiliza cuando tenemos ms de una
ventana de resultados abierta. Lo que hace es comunicarle al programa que
todos los resultados que generemos se deben representar en
la ventana designada. Cuando tenemos ms de una ventana abierta el programa
adhiere los resultados nuevos a la ltima ventana que se haya abierto, lo cual
puede ocasionar confusin y posiblemente prdida de la informacin. Para
evitarlo debemos activar el icono en la ventana que deseemos utilizar para los
nuevos resultados. Para designar una ventana hacemos clic en el icono de
manera que su color desaparezca.

Figura 1-58

La ltima seccin que encontramos dentro de las opciones


de ventana corresponde a la barra de opciones de navegador [Fig.1-58]. En
esta barra encontramos una serie de botones que nos permiten realizar tareas
con el navegador como Ascender, Degradar, Expandir, Contraer, Mostrar,
Ocultar, Insertar Ttulo,, Insertar encabezado e Insertar Texto. Desde luego, la
activacin de estas opciones slo tiene efectos en
el navegador de resultados por lo que dejamos su exploracin al lector.

Exportar Resultados de SPSS


Una de las alternativas ms sobresalientes que se puede apreciar en
el Visor deresultados corresponde a Exportar. A travs de este procedimiento
podemos enviar los resultados obtenidos mediante SPSS a una gran diversidad
de formatoscomo Html (Paginas Web), de texto, Word/RTF y Excel. Esta
opcin nos permite compartir los resultados del paquete con nuestros
colaboradores o incluso subirlos a Internet, a travs de la creacin de archivos
de resultados en otros formatos de mayor difusin.

Para exportar resultados de SPSS, debemos ir al men Archivo y escoger la


opcin Exportar, de modo que surja el cuadro de dilogo correspondiente
[Fig.1-59]. A travs de este cuadro se definen los parmetros que sern
exportados, as como las propiedades del archivo resultante.

Figuras 1-59

Para exportar los resultados, es necesario elegir en la lista de exportacin el


tipo de elementos que van a ser exportados [Fig.1-60]. Se puede exportar
los resultados y los grficos, los resultados sin los grficos slo los grficos.
Una vez seleccionado el tipo de elementos, definimos el nombre del archivo
resultante (Introduzca un nombre de archivo para los documentos
de resultados o un nombre clave para los grficos [si est seleccionada la
opcin slo grficos]). Por lo general los resultados son guardados bajo el
nombre OUTPUT. Si deseamos cambiar el nombre es necesario ingresar en la
casilla Exportar archivo una nueva ruta o un nuevo nombre para el archivo
resultante.
Figuras 1-60 y 1-61

Despus de definir el nombre del archivo, determinamos en la seccin Exportar


qu, los elementos que vamos a remitir. En esta seccin encontramos las
opciones Todos los objetos (Tablas y grficos), todos los objetos visibles y la
opcin objetos seleccionados. Cuando se ha sealado la opcin Slo grficos
en la lista de tipo de exportacin, se exhibe en la seccin Exportar qu las
opciones de la figura 1-61.

Por ltimo debemos definir el formato de exportacin; para exportar los


documentos de resultados con o sin grficos el programa nos ofrece slo
cuatro diferentes formatos Archivo Html (*.htm), Archivo de texto (*.txt), Archivo
Word/RTF (*.doc) o Archivo de Excel [Fig.1-62]. Si por el contrario se exportan
slo los grficos, el programa nos ofrece una gran variedad de formatos [Fig.1-
63], entre los que encontramos metarchivo de Windows (WMF), mapa de bits
de Windows (BMP), PostScript encapsulado (EPS), JPEG, PNG y PICT de
Macintosh.

Figuras 1-62 y 1-63

Para comprender mejor la forma de exportar los resultados, vamos a


transportar a manera de ejemplo las tablas de frecuencia que hemos creado en
los apartados anteriores. Para realizarlo vamos a seleccionar en la lista de
exportacin la opcinDocumentos de resultados [sin grficos]; luego de elegir la
opcin, nos dirigimos a la seccin Exportar archivo y hacemos clic en el
botn Examinar de manera que aparezca la ventana de exploracin [Fig.1-64].

Por medio de esta ventana ubicamos en la casilla Guardar en, la carpeta


Escritorio y sucesivamente hacemos clic en Guardar. Una vez volvemos al
cuadro de exportacin, escogemos en la seccin Exportar qu, la opcin Todos
los objetos de manera que obtenemos los resultados de la figura [1-65].
Inmediatamente se comprueba que coinciden las condiciones de exportacin,
hacemos clic en Aceptarcon lo que el archivo es creado en el escritorio.
Figuras 1-64 y 1-65

Es aconsejable que antes de realizar una exportacin de resultados se eliminen


losresultados que no vayan a ser enviados, para que no se presenten
dificultades durante o despus de la exportacin. Es necesario aclarar que las
propiedades interactivas de los resultados se perdern al momento de realizar
la exportacin, por lo que es fundamental realizar antes la edicin de
los resultados.

Guardar archivos o ficheros en SPSS


SPSS nos permite guardar los archivos que se generan en cada una de las
ventanas del paquete (Datos, Resultados o Sintaxis). A pesar que
el procedimiento para guardar un archivo es similar en todas las ventanas,
nos enfocaremos exclusivamente en la ventana Editor de datos, ya que el
cuadro de dilogo empleado en esta ventana presenta algunas diferencias
respecto a los cuadros obtenidos para las ventanas de Resultados y
Sintaxis.
Para guardar un archivo de datos, debemos dirigirnos al men Archivo y
seleccionar la opcin Guardar como; al elegir esta opcin aparece la
ventana de navegacin [Fig.1-66]. Si nos fijamos en el contenido de la
ventana, notaremos que en la parte inferior aparecen tres opciones y a su
vez en el costado derecho se encuentra un botn denominado Variables.

Estos elementos surgen, debido a que SPSS nos permite guardar los
archivos de datos en una diversidad de formatos como Excel, dBASE, SAS,
Archivos de texto, etc. Cuando se elige el formato Excel en la
seccin Guardar como, se habilitan las dos primeras opciones de la ventana
(Escribir nombres de variables en hoja de clculo y Guardar etiquetas de
valores donde se hayan definido en vez de los valores de datos). Si por el
contrario se elige el formato SAS, solamente se activa la ltima opcin
(Guardar etiquetas de valor en un archivo .sas). La utilidad de estas
opciones radica en la posibilidad de guardar aspectos informativos
fundamentales de las variables, dentro de los archivos de otro tipo de
formato.
Figuras 1-66 y 1-67

Por otro lado, el botn Variables nos permite definir las variables que sern
incluidas dentro del archivo. Al activar este botn, surge un nuevo cuadro de
dilogo [Fig.1-67], a travs del cual se especifican las variables del archivo
resultante. Por defecto el programa selecciona todas las variables; si se
desea excluir algunas de ellas, es necesario hacer clic sobre la casilla de
seleccin que se encuentra al costado izquierdo de la variable, de manera
que desaparezca la marca X. Por lo general, este procedimiento es
empleado cuando deseamos guardar parte o la totalidad de las variables
dentro de un archivo de formato distinto al de SPSS. Por el momento no
utilizaremos esta opcin, por lo que hacemos clic en el botn Cancelar de
esta nueva ventana.

Si lo que deseamos es guardar el archivo en formato de SPSS (*.sav), slo


es necesario ubicar el lugar del ordenador donde queremos guardarlo,
asignarle un nombre al archivo y finalizar haciendo clic en el botn Guardar.
Antes de guardar el archivo, vamos a conocer la ventana de sintaxis. Si nos
fijamos en los botones de la ventana de navegacin [Fig.1-66], notaremos
que aparece un botn bajo el nombre de Pegar el cual se encuentra
presente en la mayora de los cuadros de dilogo delpaquete.

Por medio de este botn se le especifica al programa que agregue a la


ventana de sintaxis, los comandos (Palabras clave) del procedimiento que
estamos realizando. A manera de ejemplo vamos a crear una nueva
ventana de sintaxis con el procedimiento Guardar; para lograrlo, ingresamos
en la casilla Nombre del archivo de la ventana de navegacin, la
leyenda Ejemplo y sucesivamente ubicamos la unidad [C:] en la
casilla Guardar en. Para finalizar hacemos clic en el botn Pegar con lo que
el procedimiento es pegado en una nueva ventana de sintaxis.

Ventana de Sintaxis de SPSS


La ventana de sintaxis nos permite trabajar los procedimientos del paquete
mediante palabras de cdigo, lo que es particularmente ventajoso cuando
manejamos anlisis continuos; es decir, cada cierto tiempo tenemos que
realizar el mismo anlisis a una base de datos cuyos registros se actualizan
con cierta regularidad.
La utilizacin de la sintaxis reduce el tiempo que se invierte en el
procesamiento de los datos y la generacin de los reportes o resultados. SPSS
nos permite ir ms all y generar procesos que realicen todo el reporte de
forma automtica, agregndolo simplemente en las tareas programadas del
PC.

Para acceder a la ventana de sintaxis, contamos con dos posibilidades; la


primera consiste en ir al men Archivo, seleccionar el procedimiento Nuevo y
elegir la opcin Sintaxis [Fig.1-68]. La segunda alternativa consiste en
hacer clic sobre el botn Pegar, que aparece en la mayora de los cuadro de
dilogo de los diferentes procedimientos del paquete, de manera que se active
de forma automtica la ventana de sintaxis [Fig.1-69]. Si nos fijamos en los
mens de esta ventana notaremos que cuenta con los mismos mens descritos
para el editor de datos a excepcin de un nuevo men denominado Ejecutar.

Figuras 1-68 y 1-69

Un archivo de sintaxis es simplemente un archivo de texto que contiene


comandos o palabras claves. Aunque es posible abrir una ventana de sintaxis y
escribir comandos, con frecuencia es ms sencillo permitir que el programa nos
ayude a construir el archivo pegando la sintaxis de comandos directamente de
los cuadros de dilogo. Para generar un archivo de sintaxis, se han establecido
algunas normas bsicas que se deben cumplir para garantizar el ptimo
funcionamiento de los procedimientos. Las reglas de la sintaxis son:

Cada comando debe empezar en una lnea nueva y terminar con un punto
(.).
La mayora de los subcomandos estn separados por barras inclinadas (/).
La barra inclinada que precede al primer subcomando de un comando,
generalmente es opcional.
Los nombres de variable deben escribirse completos.
El texto incluido entre apstrofos o comillas debe ir contenido en una sola
lnea.
Cada lnea de la sintaxis de comando no puede exceder los 80 caracteres.
Debe utilizarse un punto (.) para indicar decimales, independientemente
de la configuracin regional de Windows.
Los nombres de variable que terminen en un punto pueden causar errores
en los comandos creados por los cuadros de dilogo. No es posible crear
nombres de variable de este tipo en los cuadros de dilogo y en general
deben evitarse.
Para comprender la forma de pegar y correr la sintaxis de un procedimiento,
vamos a retomar la tabla de frecuencias que realizamos para las variables
Gnero y Estados civil (estciv) en los apartados anteriores. Para realizarlo nos
apoyaremos en uno de los botones de la barra de herramienta descritos
con anterioridad correspondiente a Recuperar cuadros de dilogo ( ); al
activarlo se despliega la lista de procedimientos que se han generado con el
programa; en ella elegimos la opcin frecuencias, con lo que surge
nuevamente el cuadro de dilogo correspondiente [Fig.1-70]. Una vez aparece
el cuadro, ubicamos en la lista las variables Gnero y Estciv y las ingresamos
en la casilla de seleccin. Despus de ingresarlas hacemos clic en Pegar, de
modo que se cierre el cuadro Frecuencias y a su vez aparece en la ventana de
sintaxis los comandos del procedimiento [Fig.1-71].

Figura 1-70

Figura 1-71

Para correr (Ejecutar) los comandos de sintaxis, tenemos dos opciones; la


primera es seleccionar cualquiera de las opciones del men Ejecutar (Todo,
Seleccin, Actual o Hasta el final) y La segunda opcin para correr los
comandos de sintaxis corresponde al botn ejecutar seleccin ( ) ubicado en
la barra de herramientas.

Al seleccionar la opcin Todo del men Ejecutar, el programa ejecuta todos los
comandos de sintaxis que se encuentren en el archivo; si por el contrario
elegimos la opcin seleccin, el programa ejecuta solamente los comandos
seleccionados por el usuario dentro del archivo. Si elegimos Actual, el
programa ejecuta la sintaxis del comando en el que se encuentre el cursor de
ratn. Por ltimo si elegimos hasta el final, el programa ejecuta la sintaxis de
comandos que se encuentren desde la ubicacin del cursor del ratn hasta la
sintaxis del fin del archivo.

Ventana de Sintaxis de SPSS 2a. Parte


Sin importar que mtodo empleemos para correr la sintaxis, una vez la
corramos aparecen en el visor de resultados las ilustraciones de
los procedimientos [Fig.1-72].

La utilidad de la sintaxis radica en la posibilidad de guardar los comandos de


mltiples procedimientos y ejecutarlos cuantas veces queramos, sin necesidad
de volver a definir cada uno de los cuadros de dilogo. Adicionalmente, si por
algn motivo se alteran los datos del archivo, ya sea porque se adiciona
informacin, se reemplazan algunos valores o se eliminan casos, los clculos
de losprocedimientos de la sintaxis sern realizados de acuerdo a la
informacin que contenga el archivo al momento de ejecutar el archivo de
sintaxis.

Figuras 1-72

Es importante resaltar que el programa nos permite modificar los parmetros


de los diferentes procedimientos, directamente en la ventana de sintaxis,
simplemente reemplazando las palabras clave o cdigos. A manera
de ejemplo, vamos a modificar el procedimiento Frecuencias, de manera que
aparezca en los resultadosla tabla de la variable Regin; para realizarlo,
debemos volver a la ventana de sintaxis y ubicar en ella el procedimiento
FREQUENCIES.

A continuacin reemplazamos la variable Gnero por la variable Regin, por lo


que colocamos el cursor sobre la palabra Gnero y por medio del teclado
ingresamos la frase regin. Para finalizar hacemos clic en el botn Ejecutar ( )
creando las tablas en el visor de resultados [Fig.1-73].
Al observar los resultados, notaremos que ha desaparecido la tabla de la
variable Gnero y en su lugar se encuentra la tabla de la variable Regin.

Figura 1-70

En conclusin, la ventana de sintaxis nos permite guardar los comandos de los


diferentes procedimientos que se realicen con el programa, ofrecindonos la
posibilidad de ejecutarlos varias veces, sin importar los cambios que se le
efecten a los datos del archivo; adicionalmente, la sintaxis nos permite
generar nuevosprocedimientos a partir de los comandos de una aplicacin,
simplemente modificando las variables o las palabras clave, lo que representa
un ahorro de tiempo en la generacin del procesamiento.

CAPITULO II: AYUDA (YO NO VOY A DICTAR ESTE CONTENIDO)

CAPITULO III
En los procesos de investigacin la informacin proviene de diferentes fuentes,
como lo pueden ser las encuestas, las mediciones, los experimentos e incluso
de investigaciones previas. Generalmente esta informacin es recopilada en
diversosprogramas de computadora que permiten organizarla, de acuerdo a las
caractersticas de los datos y las normas estructurales del programa en que se
originen, para luego ser analizada y extraer de ella las respectivas
conclusiones.

SPSS nos ofrece dos diferentes formas de elaborar archivos de datos. La


primera es crendolo directamente en el Editor de datos, introduciendo la
informacin (Variables y Casos) dentro de las casillas de la Vista de datos y la
segunda es importando la informacin desde una fuente externa (Programa de
computadora), donde la informacin se encuentra previamente organizada y
cuyo formato debe ser compatible con SPSS.
Sin importar que mtodo empleemos para generar un archivo de datos en
SPSS, una vez se ingresa la informacin, debemos definir las propiedades de
las variables y realizar una depuracin de los datos antes de comenzar con el
anlisis.

Indice Temtico -Captulo III: Archivos de Datos en SPSS


Leccin 1 Archivos de Datos
Leccin 2 Definir Propiedades
Leccin 3 Definir Propiedades II
Leccin 4 Definir Variables III
Leccin 5 Ingresar Datos
Leccin 6 Importar Informacin
Leccin 7 Importar de Excel
Leccin 8 Archivos de Texto
Leccin 9 Texto Delimitados I
Leccin 10 Texto Delimitados II
Leccin 11 Texto Delimitados III
Leccin 12 Texto de Ancho Fijo
Leccin 13 Texto de Ancho Fijo II
Leccin 14 Importar Base Datos
Leccin 15 Bases de Datos II
Leccin 16 Bases de Datos III
Leccin 17 Bases de Datos Fin
Leccin 18 Definir Propiedades
Leccin 19 Definir propiedades II
Leccin 20 Copiar Propiedades
Leccin 21 Copiar Propiedades II
Leccin 22 Fundir Archivos
Leccin 23 Aadir Variables
Leccin 24 Aadir Variables II
Leccin 25 Depurar Datos
Leccin 26 Buscar Datos SPSS
Leccin 27 Calculadora de SPSS
Leccin 28 Depurar Datos Fin

Crear Archivos o Ficheros de Datos en SPSS


Para generar un archivo de datos en SPSS, es necesario cumplir con dos
parmetros fundamentales; el primero corresponde a tratar de introducir la
informacin de forma numrica (siempre que sea posible); para lo cual es
preciso otorgar nmeros de identificacin a las categoras de las variables
Ordinales o Nominales, as como tambin a las variables que contengan
valores perdidos estipulados por el usuario. El segundo parmetro es definir
cada una de las propiedades de las variables (ver captulo I), de acuerdo a
las caractersticas de los datos que contiene. Para comprender mejor la
metodologa empleada en la elaboracin de un archivo de datos en SPSS,
vamos a generar un archivo con los datos de la siguiente encuesta,
realizada a cinco personas.

Nmero de encuesta ______

1. En la actualidad su estado civil es?

2. Cul es su nivel de educacin de acuerdo al ttulo mximo obtenido?

3. Cul es su edad actual en aos cumplidos? ______

Antes de iniciar el ingreso de la informacin de cada una de las encuestas,


es necesario definir la estructura del archivo de acuerdo al orden de las
preguntas y el tipo de datos obtenidos con ellas. Para realizarlo debemos
apoyarnos en el formato de la encuesta y tratar de identificar cada una de
las variables que podemos obtener de ella.

Si nos fijamos en la encuesta de ejemplo, notaremos que en la parte


superior se agrega un espacio para el nmero de identificacin de la
encuesta; este valor es de suma importancia ya que al momento
de depurar los datos de la encuesta (Corregir errores), este valor nos
indicar la ubicacin de la fuente (Formulario de encuesta), en donde se
presento el error y nos permite remitirnos a l para intentar corregirlo. Dada
la importancia de este dato, definiremos el nmero de encuesta como
nuestra primera variable y le asignaremos el nombre (Numeiden).

Una vez definido el nmero de encuesta, seguimos bajando y nos


encontramos con la primera pregunta En la actualidad su estado civil es?,
para lo que contamos con 5 posibles respuestas. Esta pregunta debemos
considerarla como una variable, la cual puede tomar cinco diferentes
estados (Opciones), cada uno de los cuales nos define un estado civil
distinto. Para facilitar la captura de los datos en esta pregunta, debemos
asignarle un valor representativo a cada una de las opciones de respuesta
iniciando con el nmero uno (1) y aumentando de uno en uno de acuerdo a
cada opcin, de manera que cada categora pueda ser diferenciada
fcilmente.

Dado que es posible que alguno de los encuestados no responda la


pregunta; es decir, no seleccione ninguna de las opciones, le otorgaremos a
este suceso el valor nueve (9), con lo que los datos quedaran [Variable =
Estciv], (Soltero = 1, Casado = 2, Divorciado = 3, Viudo = 4, Unin libre =5 y
No responde = 9).
La segunda pregunta corresponde a Cul es su nivel de educacin de
acuerdo al ttulo mximo obtenido?, para lo que tenemos seis diferentes
categoras u opciones de respuesta. Al igual que en la pregunta anterior,
esta pregunta debe ser considerada una variable a la que le otorgamos un
nombre y a su vez, debemos asignarle un valor a cada categora y precaver
la falta de respuesta, por lo que los datos quedan [Variable = Niveduc]
(Primaria = 1, Secundaria = 2, Preparatoria = 3, Universidad = 4, Postgrado
= 5, Doctorado = 6 y No responde = 9).

Por ltimo encontramos la pregunta Cul es su edad actual en aos


cumplidos?,note que esta pregunta no cuenta con opciones de respuesta,
sino que por el contrario nos ofrece un espacio en el cual ingresar el valor;
esta variable es de otro tipo de medida y por lo tanto su tratamiento es
diferente. Para las variables de escala como la edad, el peso, la distancia o
las ventas, no se le asignan valores representativos, ya que sus datos
representan magnitudes o cantidades y no categoras de pertenencia.
Despus de establecer la estructura de las variables y organizarla
adecuadamente, obtenemos los resultados de la figura [3-1].

Figura 3-1

Despus de establecer la estructura del archivo, estamos listos


para ingresar la informacin de las encuestas. Para realizarlo SPSS nos
ofrece dos posibilidades;ingresar primero los datos antes de definir las
propiedades de las variables o definir primero las propiedades de las
variables e ingresar posteriormente los datos. Dado que la definicin de las
variables se puede emplear como orientacin en el ingreso de los valores
de los datos, es recomendable utilizar siempre la segunda opcin; es decir,
definir primero las propiedades de las variables y a continuacin ingresar los
datos.

Para definir las propiedades de las variables es indispensable crear un


nuevo archivo de datos en SPSS. Si an no has abierto el programa, es
necesario abrirlo mediante la ruta Inicio... Programas... SPSS para
Windows... SPSS 12.0 para Windows o mediante el acceso directo (si
existe). Una vez se activa el programa aparece el asistente de inicio, en el
cual hacemos clic en el botn Cancelar, de manera que desaparezca y surja
en su lugar la ventana Editor de datos de SPSS lista para trabajar [Fig.3-2].
Figuras 3-2 y 3-3

Para poder definir las propiedades de las variables es necesario hacer clic
sobre la pestaa Vista de variables en la parte inferior izquierda del editor,
de manera que el contenido de la ventana cambie y nos muestre las
columnas de propiedad [Fig.3-3]. Es importante recordar que en esta vista
las variables se ubican en las filas y las propiedades en las columnas.

Ejemplo: Definir Propiedades de Variables


SPSS
Para iniciar la definicin de los parmetros de las variables, debemos ubicar
el puntero del ratn dentro de la primera casilla de la
columna Nombrecorrespondiente a la fila 1. Una vez se activa la casilla,
ingresamos las letras del nombre de la primera variable que en est caso
corresponde a Numeiden. Es de gran importancia que el nombre que se le
asigne a cada una de las variables del archivo cumplan satisfactoriamente
todas las condiciones requeridas por el programa, como lo pueden ser la
longitud (64 caracteres para la versin 12.0 y 8 caracteres para las
versiones anteriores), no iniciar con un nmero, no contener caracteres
especiales, etc.

Para pasar a la siguiente casilla de la fila, correspondiente a la


columna Tipo, es necesario oprimir el botn TAB ( ) en el teclado o
hacer clic con el puntero del ratn sobre ella. Note como al activarse la
segunda casilla, aparecen en las diferentes casillas de la fila una serie de
valores [Fig. 3-4], esto se debe a que el programa automticamente rellena
cada una de las propiedades de la variable con los valores por defecto; es
necesario resaltar que estos valores deben ser reemplazados de acuerdo a
las caractersticas de la variable, ya que el programa no evala las
caractersticas de los datos de la variable, si no que asigna los valores ms
comunes.

Figura 3-4

Dado que los valores de la variable representan el nmero de identificacin


de la encuesta, mantendremos el tipo Numrico para la variable Numeiden.
A continuacin debemos pasar a la siguiente columna de propiedad
correspondiente a Anchura; como vimos en el captulo inicial, este
parmetro es netamente informativo y a su vez, est directamente
relacionado con la propiedad Decimales.

La anchura hace referencia a la longitud de los valores que encontraremos


en la variable, pero esto no restringe la posibilidad que se pueda encontrar
un valor que supere dicha longitud; es necesario recordar que la anchura se
establece teniendo en cuenta el nmero de cifras decimales de los valores.
Dado que la encuesta slo se realiza a cinco personas y por lo tanto no hay
necesidad de valores decimales, definiremos la anchura en el valor uno (1).

Antes de ingresar el valor de la anchura de la variable Numeiden, es


indispensable modificar primero el nmero de cifras decimales a cero en la
respectiva columna o de lo contrario aparece el mensaje El nmero de cifras
decimales es demasiado largo para la anchura del campo [Fig.3-5].

Figura 3-5

Una vez definimos las propiedades Anchura y Decimales y especificamos


que el nmero mximo de cifras que aparecen en la variable es de uno (1),
pasamos a la siguiente casilla de propiedad correspondiente a Etiqueta. Las
etiquetas nos permiten ingresar informacin adicional para aclarar el
contenido de las variables en los resultados; cuando no se declara una
etiqueta, el programa incluye en todos los resultados el nombre de la
variable, lo cual puede ser contraproducente al momento de interpretar las
conclusiones de las tablas o grficos.

Para la variable Numeiden emplearemos como etiqueta el nombre que


encontramos en la fuente; es decir, Nmero de encuesta. Despus de
definir la etiqueta, continuamos con las dems propiedades; dado que para
la variable Numeiden no existen categoras o valores perdidos, las
propiedades Valores yPerdidos no deben ser modificadas. Debido a que las
propiedades Columna yAlineacin son netamente de formato y
sus resultados slo son apreciables en la vista de datos del Editor, dejamos
estos valores a voluntad del lector, de acuerdo a como desee observarlas.

Por ltimo encontramos la propiedad correspondiente a Medida; esta


facultad es sin ninguna duda el parmetro ms importante de las
propiedades de las variables, ya que de ella depende en gran medida el tipo
de anlisis que se puede realizar con la variable y por lo tanto los
procedimientos del paquete en los que puede ser utilizada. Si nos fijamos
en los valores que puede tomar esta variable, notaremos que son nmeros
enteros, los cuales representan una cantidad por lo que podemos concluir
que la variable Numeiden (Nmero de encuesta) corresponde a la medida
de Escala (Ver captulo 1).

Para activar el tipo de medida, debemos hacer clic sobre la casilla de la


respectiva columna, de manera que aparezca al costado derecho de ella un
botn flecha hacia abajo ( ),quien nos indica que cuenta con una listado; al
hacer clic sobre l, surgen los tres diferentes tipos de medida con que
cuenta SPSS [Fig.3-6]. Para escoger uno de ellos basta con hacer clic sobre
el tipo que deseemos, de manera que desaparece el listado y queda en la
casilla el tipo de medida elegido.

Figura 3-6

Una vez terminamos de definir las propiedades de la variable Numeiden


(Nmero de encuesta), obtenemos los resultados de la figura [3-7]. Este
mismo procedimiento debe ser realizado con todas y cada una de las
variables del archivo; a manera de ejercicio, intenta efectuar la definicin de
las variables restantes y posteriormente vuelve al libro para comparar
los resultados.

Figura 3-7

Definir Propiedades de Variables 2da Parte


Para agilizar el ejemplo, declararemos los parmetros de las tres variables
restantes en un solo proceso, tratando de hacer nfasis en las propiedades en
que se presenten diferencias entre ellas. Desde luego no es aconsejable
realizar la definicin simultnea de variables, ya que puede prestarse para
cometer errores graves; aqu lo realizaremos con el nimo de disminuir el
tiempo de interpretacin del lector y no por que consideremos que es una
prctica apropiada. Es importante aclarar que siempre que se realice la
definicin de mltiples variables, lo ms indicado es declarar todos los
parmetros de una variable antes de continuar con la siguiente.
Lo primero que debemos realizar para las tres variables restantes, es definir el
nombre de cada una de ellas. Para hacerlo debemos ubicar el puntero del ratn
sobre la casilla de la columna Nombre perteneciente a la fila nmero dos (2).
Una vez se activa la casilla ingresamos las letras del nombre de la segunda
variable, que para el caso corresponde a Estciv (Estado civil). Para la tercera
variable nos ubicamos en la casilla de la fila tres (3) e ingresamos el nombre
Niveduc (Nivel de educacin); por ltimo nos ubicamos en la casilla de la fila
cuatro (4) e ingresamos el nombre Edad (Edad en aos). Despus
de ingresar todos los nombresobtenemos los resultados de la figura [3-8]. Note
como al ingresar cada uno de los nombres de las variables, van apareciendo
los valores por defecto del programa, en las dems casillas.

Figura 3-8

Continuando con el ejemplo debemos definir el Tipo. Si nos fijamos en los


posibles valores que pueden tomar los datos en cada una de las variables,
notaremos que son numricos aunque algunos de ellos representen categoras
y otros por el contrario representen magnitudes o cantidades. Debido a que los
datos contenidos son nmeros, no modificaremos el valor por defecto
seleccionado por el programa; es decir, mantendremos el tipo Numrico para
las tres variables.

Una vez establecido el tipo de variable, debemos definir la propiedad Anchura;


para hacerlo es necesario remitirnos a la tabla de la figura [3-1] y observar
cuales son los posibles valores que pueden tomar los datos en cada una de las
variables. Si observamos la variable Estciv (Estado civil), notaremos que
cuenta con cinco posibles respuestas y adems se agrega la
opcin No responde; para esta variable, los datos slo toman valores enteros
de un digito. Lo mismo ocurre para la variable Niveduc (Nivel de educacin),
mientras que para la variable Edad (Edad en aos) los valores deben ser de
dos cifras, ya que nos indican la cantidad de aos cumplidos del encuestado; a
pesar que es posible que alguno de ellos supere los cien aos, slo
asignaremos para esta variable un ancho de dos cifras, que corresponde a las
cantidades ms comunes.

Despus de comprobar la longitud de los datos en cada una de las variables,


debemos ingresar los valores en las respectivas casillas. Es importante
recordar que antes de modificar la anchura de cada variable, es necesario
modificar primero el nmero de cifras decimales, ya que estas cifras
son tenidas en cuenta para determinar el ancho. Una vez se modifican los
valores de las propiedades Anchuray Decimales, obtenemos los resultados de
la figura [3-9].
Figura 3-9

Una vez establecidos los valores de Anchura y Decimales, debemos definir las
Etiquetas o leyendas informativas que para este caso son (Estciv = Estado civil,
Niveduc = Nivel de educacin y Edad = Edad en aos). Para ingresar las
etiquetas, se deben seleccionar cada una de las casillas e ingresar las
letrascorrespondientes, de manera que se obtengan los resultados de la figura
[3-10].

Figura 3-10

La siguiente propiedad que debemos definir corresponde a Valores o Etiquetas


de valor; debemos recordar que esta propiedad slo se define para las
variables categricas (Nominal u Ordinal) o para las variables que contiene
valores perdidos definidos por el usuario (No sabe, no responde, No aplica,
etc.). Si nos fijamos en la variable Edad, notaremos que esta variable no tiene
categoras o valores perdidos y por lo tanto no se deben definir Valores o
etiquetas de valor para ella. Las variables Estciv y niveduc por el contrario, si
cuentan con valores de pertenencia y valores perdidos por lo que es
indispensable definirlos.

Para realizarlo debemos activar la casilla correspondiente, de manera que


aparezca al costado derecho un botn con puntos suspensivos ( ), una vez
aparece el botn hacemos clic sobre l, surgiendo una nueva ventana [Fig.3-
11]. A travs de esta ventana se definen las categoras que representan cada
uno de los valores de la variable; si por algn motivo un valor no es definido
dentro de esta ventana, el nmero aparecer en los resultados (Tablas y
Grficos) que se generen con la variable.

Figura 3-11

Para definir los valores de una variable, basta con ingresar el nmero en la
casillaValor, sucesivamente ingresar en la casilla Etiqueta de valor las letras de
la categora a la que corresponde y finalizar haciendo clic en el botn Aadir.
Este proceso debe realizarse por cada uno de los valores que tome la variable.
Paracontinuar con el ejemplo ingresaremos el nmero uno (1) en la casilla
valor, posteriormente hacemos clic en la tecla TAB ( ) para pasar a la
siguiente casilla o hacemos clic sobre la casilla e ingresamos en su interior la
frase Soltero. Para finalizar hacemos clic en el botn Aadir, de manera que
aparece en la casilla de seleccin la frase (1 = Soltero) [Fig.3-12]. Esta
leyenda es la confirmacin que el valor y la etiqueta han sido definidos
satisfactoriamente.

Figura 3-12

Este mismo proceso debe ser realizado con cada uno de los valores de la
variable estciv (Estado civil), de manera que se definan los valores
(2=Casado, 3=Divorciado, 4=Viudo, 5=Unin libre y 9=No responde).

Definir Propiedades de Variables 3ra Parte


Despus de ingresar todos los valores y sus respectivas etiquetas obtenemos
losresultados de la figura [3-13]. Para finalizar hacemos clic en Aceptar con lo
que volvemos a la Vista de datos de SPSS. Es necesario aadir todos
los valores y sus etiquetas de valor antes de hacer clic en Aceptar o de lo
contrario se perder la informacin que no haya sido aadida. Si se desea
modificar alguna etiqueta o alguno de los valores, se debe sealar en la casilla
de seleccin la opcin que se desea transformar y editar el nmero o la
leyenda; para guardar los cambios es necesario hacer clic en el botn Cambiar.

Figura 3-13

Despus de definir los valores para la variable Estado civil, realizamos el


mismo procedimiento para los valores de la variable Nivel de educacin
(Niveduc), teniendo en cuenta que la asignacin sea igual a (1=Primaria,
2=Secundaria, 3=Preparatoria, 4=Universidad, 5=Postgrado,
6=Doctorado y 9=Noresponde). Una vez ingresados todos los valores y sus
respectivas leyendasobtenemos los resultados de la figura [3-14].

Para finalizar hacemos clic en Aceptar con lo que volvemos al editor de datos
de SPSS. Note que en las dos variables (Estciv y Niveduc) se asigno el nmero
nueve (9) a los valores perdidos definidos por el usuario (No responde); esto se
hace con el fin de facilitar su identificacin dentro del archivo de datos y es
recomendable mantener los mismos nmeros para los valores perdidos de las
dems variables, siempre que sea posible.

Figura 3-14

Inmediatamente se definen las etiquetas de valor, se deben definir


los valoresperdidos. Es ms importante definir los valores perdidos dentro de la
columnaPerdidos, que dentro de la columna Valores, ya que si no se le define
al programa que el numero nueve (9) es un valor perdido, lo emplear para
realizar todos los clculos que le sean solicitados a travs de los diferentes
procedimientos, lo cual puede afectar severamente los resultados.

Para definir un valor perdido, debemos activar la casilla de la respectiva


columna de manera que aparezca al costado derecho un botn con puntos
suspensivos ( ); al hacer clic sobre el botn, surge una nueva ventana [Fig.3-
15]. Por medio de este cuadro de dilogo se definen los valores perdidos por
el usuario, eligiendo alguna de las tres alternativas que nos ofrece. La primera
consiste en la ausencia devalores perdidos (Opcin por defecto), la segunda
consisten en tres valoresdiscretos (Aleatorios) los cuales deben ser
introducidos por el usuario y la tercera corresponde a un rango ms un valor
discreto.
Figura 3-15

Dado que en nuestras variables slo existe un valor perdido, seleccionamos la


segunda opcin (Valores perdidos discretos) e introducimos en la primera
casilla el nmero nueve (9) correspondiente a la opcin No responde [Fig.3-16].

Figura 3-16

Debemos recordar que un valor perdido es una razn por la cual no obtengo
informacin del entrevistado. El nmero 9 nos indica que no obtuve informacin
por que el entrevistado no respondi. Es aconsejable utilizar nmeros elevados
para losvalores perdidos, de manera que estn separados del rango til
(valoresrepresentativos de categoras), ya que esto facilita su identificacin.
Para finalizar hacemos clic en Aceptar con lo que volvemos al editor de datos
de SPSS.

Ingresar Datos en los Archivos de SPSS


Continuando con la definicin de las propiedades de las variables, nos
encontramos con las opciones Columnas y Alineacin, estas dos propiedades
son netamente de formato y por lo tanto las dejamos a voluntad del lector.

Por ltimo encontramos la propiedad Medida; este parmetro hace referencia al


tipo de datos que se encuentran en la variable y define el tipo de anlisis que
se puede realizar con ella. Si nos fijamos en los posibles valores que pueden
tomar las variables Estado civil y Nivel de educacin, notaremos que contienen
categoras de pertenencia. Si tratamos de establecer un orden lgico con las
categoras de la variable Estado civil, no lo conseguiramos ya que cualquiera
de los encuestados puede pasar de un estado a otro sin seguir un orden lgico,
lo que nos indica que esta variable es de tipo Nominal.

Si por el contrario lo intentamos con las categoras de la variable Nivel de


educacin, apreciaremos que si existe un orden entre sus categoras, ya que
seria ilgico encontrar a una persona con doctorado sin haber terminado la
preparatoria; este orden nos sugiere que la variable Nivel de
educacin corresponde a la medida Ordinal. Por ltimo tenemos la variable
Edad, la cual vincula las cantidades o magnitudes en aos de los encuestados,
lo que nos revela que pertenece al nivel de medida de Escala.
Una vez establecidos los niveles de medida a los que corresponde cada
variable, debemos definirlas en la columna Medida. Para realizarlo, es
necesario activar la casilla y elegir del listado de medidas la opcin adecuada
para cada una de ellas. Despus de definir las medidas de las variables,
obtenemos los resultados de la figura [3-17].

Figura 3-17

Terminada la definicin de las propiedades de las variables, podemos proceder


alingreso de los datos de cada una de las encuestas. Para facilitar la
incorporacin de los datos, hemos generado una tabla con las diferentes
respuestas obtenidas en las cinco encuestas [Fig.3-18]. A su vez se anexa una
tabla con los cdigos numricos a los que equivale cada una de las respuestas,
los cuales deben ser introducidos en el editor de datos [Fig.3-19].

Figuras 3-18 y 3-19

Si nos fijamos en los resultados de las cinco encuestas, notaremos que slo se
presento la falta de respuesta en una de ellas, correspondiente a
la preguntaEstado civil de la quinta encuesta. Note como a pesar que se defini
un valor perdido para la variable Nivel de educacin, este valor no es utilizado
por ninguno de los encuestados; cuando ocurre este suceso, no es necesario
eliminar el valor ya que el nmero definido acta slo como una medida de
control a las posibles faltas de informacin en las encuesta.
Para comenzar el ingreso de la informacin, debemos seleccionar la pestaa
Vista de datos, de manera que el contenido del Editor de SPSS cambie y nos
ensee las columnas de variables. Para insertar los datos, debemos ubicarnos
en la primera casilla de la variable numeiden y comenzar a ingresar cada uno
de los nmeros. Para pasar de una variable a otra, el mtodo ms sencillo es
recurrir al botn TAB ( ) ubicado en el teclado del ordenador, ya que este
botn nos va pasando de una variable a otra hasta que llegar a la ltima
variable declarada de la fila, donde al oprimir nuevamente la tecla en TAB, el
programa activa la primera casilla de la nueva fila (Variable numeiden). Una
vez ingresamos la totalidad de los valores para las cinco encuestas (Casos),
obtenemos los resultados de la figura [3-20].
Figuras 3-20 y 3-21

Despus de ingresar los datos activamos el botn Etiquetas ( ) en la barra


de herramientas, con lo que aparecen en el editor todas las leyendas de valor
que se hayan declarado de acuerdo a cada uno de los datos [Fig.3-21]; de igual
manera podemos apreciar las etiquetas de las variables, para lo que slo
requerimos ubicar el puntero del ratn sobre el nombre de la variable con lo
que surge en la parte inferior, una leyenda con la etiqueta definida.

Para terminar de crear el archivo, debemos guardar su contenido; para


realizarlo, vamos al men Archivo y seleccionamos la opcin Guardar como,
con lo que se abre una ventana de navegacin. A travs de esta ventana
ubicamos la carpeta Mis documentos en la unidad [C:] y posteriormente le
asignamos un nombre, que para el caso es Mi primer archivo de datos. Para
finalizar hacemos clic en el botnGuardar, con lo que desaparece la ventana de
navegacin y a su vez el nombre del archivo aparece en la parte superior
izquierda del editor de datos.

Es posible que en algunas encuestas nos encontremos con otro tipo de


variables denominadas preguntas de respuesta mltiple, las cuales nos ofrecen
mayor informacin. Estas variables deben ser tratadas de manera especial
debido a sucomportamiento y estructura. Las variables de respuesta mltiple
sern abordadas con claridad en el captulo 6, por lo que no haremos nfasis
en ellas por el momento. Desde luego la mayora de las encuestas cuentan con
un elevado nmero de variables y mltiples casos (Formularios), pero su
definicin y captura se realiza de la misma forma explicada en este apartado,
por lo que la longitud del ejemplo empleado no debera causar ninguna
inquietud en el lector.

Importar Archivos de Datos a SPSS


La segunda opcin que tenemos para crear un archivo de datos es ingresar la
informacin desde otro programa de computadora; SPSS nos permite importar
informacin proveniente de mltiples fuentes de datos como Excel, Access o
archivos de texto. Para la extraccin de la informacin contenida en
estos formatos, el programa tiene establecida una estructura de captura,
basada en tres grupos. Estos grupos son determinados por las caractersticas
organizacionales de los datos dentro del archivo, cuyas propiedades son
definidas por los programas que los generan

Si nos fijamos en el contenido de la figura [3-22], notaremos que SPSS nos


permite extraer informacin de archivos de Hojas de clculo como Excel o
Lotus, as mismo de Archivos planos o de texto ya sea de formato (txt o dat) o
incluso de archivos de Base de datos como Access, Foxpro, dBase y algunas
ms elaboradas como Oracle. Para importar los archivos de base de datos,
SPSS requiere que se encuentren instalados en el ordenador los controladores
de apertura del programa que los genera, comnmente llamados
controladores ODBC.

Figura 3-22

Para cada uno de estos tipos de archivo, SPSS tiene establecido un


procedimiento diferente para su importacin. Algunos de estos formatos se
importan de forma directa, a travs de una ventana de exploracin y otros
cuentan con un asistente, quien nos gua paso a paso durante la definicin de
las propiedades. Para comprender la forma de importar la informacin de las
diferentes fuentes, vamos a realizar a manera de ejemplo una extraccin de
datos por cada uno de los formatosms comunes (Excel, Archivos planos [*.txt
y *.dat] y Base de datos Access).

1. Hojas de Clculo
Para importar la informacin contenida en un archivo proveniente de una Hoja
de clculo, ya sea de Excel o Lotus, es necesario comprobar previamente, que
los datos en el archivo cumplen con los requerimientos estructurales de SPSS.
Los parmetros que deben cumplir son Estructura de datos (los archivos de
SPSS cuentan con una estructura en sus datos [ver captulo 1], en la cual la
informacin, registros u observaciones se encuentra en las filas y las variables
en las columnas.

Para poder extraer la informacin de un archivo de Excel, es indispensable que


los datos tengan la misma estructura); Ttulos (En SPSS no se manejan los
ttulos dentro de los datos, por lo tanto los archivos que se desean importar no
deben contener ttulos o no importar las filas y columnas en la que se
encuentren); Rango(SPSS slo importa los datos que se encuentren dentro de
un rango establecido por el usuario. Si los nombres de las variables se
encuentran dentro de la primera fila de los datos, se le puede pedir al programa
que las importe).

Para comprender la metodologa empleada en la importacin de datos desde


archivos de Hojas de clculo, vamos a extraer a manera de ejemplo la
informacin contenida en el archivo Datos.xls incluido en la
carpeta Captulo3 del archivo adjunto. Antes de iniciar la importacin de los
datos, es necesario comprobar si el archivo cumple con los requerimientos de
SPSS; para realizarlo debemos abrir primero el archivo en el programa de
origen, que en este caso corresponde a Excel(Desde luego es indispensable
tener instalado el programa en el ordenador).
Si observamos las caractersticas del archivo, notaremos que esta compuesto
por dos diferentes hojas (Variables y Datos); la primera de ellas (Variables)
contiene la informacin de las variables del archivo, as como los valores de
cada una de las categoras. Por el contrario la segunda hoja (Datos), contiene
la informacin de inters. Al seleccionar la pestaa correspondiente a Datos,
obtenemos los resultados de la figura [3-23]. El objetivo de abrir el archivo, es
identificar las caractersticas de la informacin que contiene, para lo cual
debemos reconocer la existencia de ttulos, filas sin informacin,
la estructura de los datos y el rango de informacin til que se desea importar.

Figura 3-23

Si nos fijamos en el contenido del archivo, observaremos que en las primeras


seis (6) filas, encontramos un ttulo y tres filas sin informacin, este rango no
debe ser importado ya que no incluye informacin til para SPSS. Una vez
probada la existencia de ttulos, debemos comprobar la estructura de los datos
y verificar que las variables se encuentren ubicadas en las columnas y los
casos o registros estn en las filas.

Al apreciar el archivo notaremos que en la fila 7 se encuentran los nombres de


las variables y cada una de ellas esta ubicada en una columna diferente,
adems las filas que se encuentran debajo de ellas corresponden a los casos o
registros, con lo cual podemos comprobar que el archivo cuenta con
la estructura correcta.

Por ltimo debemos reconocer el rango en donde se encuentra la informacin


til; para identificarlo nos paramos en la Fila 7 Columna A y oprimimos las
teclas Control y Fin del teclado (Ctrl. + Fin), con lo cual el cursor se ubica en la
ltima fila y la ltima columna con informacin del archivo, que para este caso
corresponde a laColumna J y la Fila 307. El rango de informacin esta
establecido desde la primera Columna y Fila con informacin til, en este
caso A7, hasta la ltima casilla con informacin que el investigador desee
importar; la cual para el caso corresponde a J307.

Importar Datos desde Excel a SPSS


Continua desde Leccin Anterior. Despus de examinar las caractersticas del
archivo y verificar que cumplen con los requerimientos del paquete, debemos
cerrarlo ya que SPSS no permite importar archivos si estos se encuentran en
uso. Despus de cerrar Microsoft Excel volvemos a SPSS y seleccionamos el
menArchivo... Abrir.. Datos [Fig.3-24], de manera que surge la ventana de
navegacin [Fig.3-25].

Esta ventana requiere que le especifiquemos tres parmetros, el primero de


ellos es la ubicacin del archivo dentro del ordenador o los discos extrables
(Buscar en); la segunda corresponde al Nombre de archivo y la ltima es Tipo
de archivo o extensin a la que corresponde, para lo cual cuenta con una lista
de formatos o extensiones, a los que podemos acceder por medio de este
procedimiento. Utilizando esta ventana ubicaremos el archivo Datos con el
formato Excel (*.xls) que se incluye en el CD adjunto (E:/Captulo3/Datos.xls),
por lo que seleccionamos el formato Excel en el listado de tipo de archivos y
ubicamos por medio de la casillaBuscar en la carpeta Captulo3 en la unidad de
CD-ROM. Una vez localizamos el archivo Datos, lo seleccionamos y hacemos
clic en Abrir.

Figuras 3-24 y 3-25

Inmediatamente se hace clic en Abrir, surge en la pantalla del ordenador un


nuevo cuadro de dilogo denominado Apertura de fuente de datos
de Excel [Fig.3-26]. En este cuadro encontramos las opciones de importacin
con que cuenta SPSS para la extraccin de datos desde los archivos de Hojas
de clculo. Entre estas opciones aparecen Leer nombre de variables de la
primera fila de datos, Hoja de trabajo y Rango. Cada una de estas opciones
nos permite restringir la informacin que ser importada y desde luego algunas
de ellas son determinadas directamente por la estructura del archivo de origen.

Figura 3-26
La primera opcin Leer nombre de variables de la primera fila de datos, nos
permite capturar o extraer los nombres de las variables que aparecen en el
archivo de origen, slo si estos se encuentran en la primera fila de informacin
til del archivo y cumplen con las caractersticas requeridas. Si nos fijamos en
el contenido de la figura [3-23], notaremos que la fila siete (7) contiene los
nombres de las variables; estos nombres deben cumplir ciertas condiciones
(ver captulo I), como no tener ms de 8 caracteres (para las versiones
anteriores a la 12.0), comenzarcon una letra y no contener caracteres
especiales.

Si se cumplen estas condiciones SPSS las importar como nombres de


variables, de lo contrario las adecua para su importacin; es decir, si rebasa los
ocho caracteres tomara los primeros ocho como nombre; los espacios entre las
palabras los remplazar por el signo ( _ ) y la variables que comiencen por un
nmero o tengan palabras claves las remplazara con la letra (V) y le asigna un
nmero de acuerdo a la posicin que ocupe en el archivo. Por ejemplo, si la
variable esta ubicada en la cuarta columna, el programa le asignara el nombre
(V4). Para activar o desactivar esta opcin slo basta con hacer clic sobre ella
de manera que aparezca en la casilla de verificacin un visto bueno ( ).

La segunda opcin de importacin corresponde a la Hoja de trabajo [Fig.3-27],


la cual hace referencia a la hoja en la que se encuentra la informacin de
inters. En la parte derecha de la casilla de esta opcin se localiza un botn (
) que despliega unlistado de las hojas con que cuenta el archivo. Por defecto
SPSS selecciona la primera hoja del archivo y si la informacin que deseamos
importar se encuentra en otra hoja, es necesario definrsela al programa,
haciendo clic sobre ella en ellistado.

Figura 3-27

Por ltimo encontramos la opcin Rango, la cual hace referencia al rea de


inters donde se encuentran los datos. A travs de esta casilla se le especifica
al programa la posicin inicial y final (columna y fila), en la que se encuentran
los datos tiles. Si el archivo cuenta con los nombres de las variables en la
parte superior, es necesario ingresar esta fila al rango de importacin. En caso
contrario, es indispensable omitirlo y a su vez desactivar la primera opcin del
asistente. Es de gran importancia especificarle al programa el rango de
importacin, ya que de no hacerlo, el asistente importa toda la informacin
contenida en la hoja definida del archivo de origen, lo que nos puede ocasionar
serios inconvenientes [Fig.3-28].
Figura 3-28

Para finalizar la importacin de los datos del archivo de ejemplo, activamos la


opcin Leer nombre de variables de la primera fila de datos, sucesivamente
seleccionamos la hoja Datos en la opcin Hoja de trabajo y por ltimo
ingresamos el rango A7:J307, debemos tener cuidado de no ingresar espacios
en blanco dentro del rango, ya que SPSS no lo reconoce y aparece la
leyenda El rango no es valido. Despus de definir correctamente cada una de
las opciones, obtenemos los datos de la figura [3-29].

Figura 3-29

Para finalizar la importacin de la informacin hacemos clic en Aceptar, con lo


que los datos aparecen en el editor de datos de SPSS [Fig.3-30]. Una vez los
datos son extrados del archivo de origen, debemos guardar el archivo de
SPSS resultante. A modo de ejemplo guardaremos el archivo en la carpeta Mis
documentos, bajo el nombre Infodatos. Para realizarlo vamos al
men Archivo y seleccionamos la opcin Guardar como, al aparecer la ventana
de navegacin, ubicamos la carpetae ingresamos el nombre; para finalizar
hacemos clic en Guardar. Este archivo lo utilizaremos ms adelante, por lo que
es de vital importancia que sea guardado.

Figura 3-30

Si nos fijamos en la vista de variables del archivo resultante [Fig.3-31],


notaremos que el programa extrajo los nombres de las variables de la fuente y
que adems nos sugiere el tipo de variable al que corresponde. En algunas
ocasiones el tipo de variable sugerido no es el apropiado; esto se debe a un
error de digitacin en el cual una letra o un espacio se introdujo dentro de la
informacin.

Figura 3-31
Si la informacin requerida para la importacin se encuentra en diferentes
hojas de un mismo archivo, es necesario generar una nueva hoja donde se
recopile todos los datos, ya que este procedimiento slo permite extraer la
informacin contenida en una hoja, por cada importacin. Desde luego, para
poder obtener un archivo de datos completo, es necesario definir cada una de
las propiedades de las variables.

Importar Archivos de Texto a SPSS


Para extraer la informacin proveniente de los archivos planos SPSS dispone
de un asistente de importacin, el cual nos orienta en la descripcin de las
variables y los datos contenidos en un archivo de texto, ya sea de la
extensin *.txt o *.dat. Para definir la informacin, el asistente utiliza una
metodologa basada en seis pasos, en los que emplea una serie de preguntas
concernientes a la estructura de los datos dentro del archivo y despus de los
cuales la informacin se representa en el editor de datos.

La estructura de los archivos de texto puede ser de dos formas diferentes


denominados Delimitado y Ancho fijo; estas formas hacen referencia a la
manera como estn escritos los datos en el archivo. Generalmente se utiliza
alguno de estos mtodos para representar la informacin; con el animo de
aclarar este concepto vamos ha compararlos.

Si nos fijamos en la informacin de la figura [3-32], observaremos que cada uno


de los datos esta precedido por un punto y coma (;), el cual delimita la
informacin correspondiente a cada una de las variables. Si por el contrario nos
fijamos en la informacin de la figura [3-33], observaremos que cada uno de los
datos tiene un espacio especfico, en donde se encuentran de forma ordenada
la informacin de cada variable. Desde luego en algunas ocasiones, se cuenta
con mltiples variables lo que dificulta su apreciacin.

Figura 3-32

Figuras 3-33

Generalmente los archivos de ancho fijo no suelen incluir dentro de los datos
los nombres de las variables, por lo que reconocer la informacin comprendida
en este tipo de archivos es ms difcil. Para poder identificar la informacin
contenida en los archivos de ancho fijo es necesario trazar una lnea entre cada
una de sus variables [Fig.3-34].
Figura 3-34

En resumen las variables Delimitadas son aquellas que estn separadas por un
carcter especfico como el punto, el espacio, el tabulador, etc. Mientras que
las variables de ancho fijo son aquellas que tienen un nmero mximo de
caracteres por variable. Una vez aclarado este concepto procederemos a
importar un archivo de texto mediante el asistente de importacin. Primero
extraeremos la informacin de un archivo delimitado y despus de un archivo
de ancho fijo, con el fin de exponer las diferencias que se presentan en la
definicin de los datos.

Importar Archivos Delimitados


Para importar la informacin de un archivo de texto (ya se Delimitado o de
Ancho fijo), debemos ir al men Archivo y seleccionar la opcin
correspondiente a Leerdatos de texto [Fig.3-35], al hacer clic en ella aparece la
ventana de exploracin, con la cual debemos ubicar el archivo. Esta ventana
requiere que le especifiquemos tres parmetros, el primero de ellos es la
ubicacin del archivo dentro del Ordenador o los discos extrables; la segunda
corresponde al nombre del archivo y finalmente el tipo de archivo o extensin a
la que corresponde (Texto *.txt o Datos *.dat).

A manera de ejemplo vamos a importar el archivo delimi.txt, el cual se


encuentra en la carpeta Captulo3 del CD adjunto. Por defecto la ventana de
navegacin especfica el formato Texto [*.txt] en la opcin Tipos de archivos,
por lo que nicamente debemos ubicar la carpeta Captulo3 en la
opcin Buscar en, y luego seleccionar el archivo; para finalizar, hacemos clic
en Abrir [Fig.3-36].

Figuras 3-35 y 3-36

Una vez se abre el archivo, aparece en la pantalla del ordenador el Asistente


para la importacin de texto [Fig.3-37]; este asistente nos guiar durante
todo el proceso de importacin de los datos. Si nos fijamos en la parte superior
de este cuadro de dilogo, notaremos que este cuadro corresponde al primer
paso de seis que tiene establecidos. Cada uno de estos pasos esta orientado a
la definicin de una propiedad especifica de la informacin, como lo son la
utilizacin de un formatopredefinido, la descripcin de las variables, la
descripcin de casos, la delimitacin de las variables, las caractersticas del
nombre y formato de las variables y por ltimo las opciones de guardado.

Figura 3-28

Para este primer paso el asistente nos realiza la pregunta Se ajusta su


archivo de texto a un formato predefinido?,y nos ofrece dos posibles
respuestas (Si o No). Esta pregunta se aplica nicamente si se ha importado un
archivo de las mismas caractersticas (Variables y casos) con antelacin y se
ha guardado su definicin deformato para utilizarla como plantilla para un
nuevo archivo. Esta pregunta tiene relacin directa con una de las opciones del
sexto paso en la cual podemos elegir si deseamos guardar
las propiedades definidas para el archivo, con la intencin de emplear esas
caractersticas como plantilla para futuros archivos. Dado que es la primera vez
que vamos a importar informacin procedente de un archivo de texto
seleccionaremos la opcin NO.

Adicionalmente, en el cuadro de dilogo del paso 1 [Fig.3-37], veremos que en


la parte inferior aparece la casilla correspondiente al visor de datos; esta casilla
nos ofrece una representacin grfica de los datos que contiene el archivo que
deseamos importar. El visor de datos es de gran utilidad ya que con la
informacin contenida en l, podemos comprobar la estructura del archivo sin
necesidad de abrirlo; en los pasos siguientes la utilizaremos para determinar el
mtodo de importacin (Delimitado o Acho fijo).

Importar Archivos Delimitados a SPSS


Para continuar con la extraccin de los datos hacemos clic en el
botn Siguiente, con lo que aparece el cuadro de dilogo correspondiente al
paso 2 Tipo de archivo[Fig.3-38]. En este paso el asistente de importacin nos
hace dos preguntas concernientes al formato de los datos; la primera
corresponde a Cmo estn organizadas sus variable?, para lo cual nos da
dos posibilidades; Delimitada (Las variables estn delimitadas por un carcter
concreto [coma, tabulador]) y Ancho fijo (Las variables estn alineadas en
columnas de ancho fijo).
La segunda pregunta corresponde a Estn incluidos los ttulos de las
variables en la parte superior del archivo?, para lo que nos ofrece dos
posibles respuestas SI o No.

Figura 3-38

Para poder determinar como estn organizadas las variables dentro del
archivo, debemos observar el contenido del visor de datos [Fig.3-39] y tratar
de identificar si las variables estn separadas por un carcter comn o por
el contrario tiene un nmero especfico de columnas por variable. Si nos
fijamos en los datos del visor, notaremos que las variables se encuentran
separadas por un cuadrado ( ), el cual representa en SPSS al tabulado, con
lo que podemos determinar que las variables estn delimitadas por
tabulaciones. Es importante recordar el carcter ( = Tabulador), ya que en
los pasos siguientes, el asistente necesitar que lo especifiquemos. Una vez
definido el tipo de archivo, debemos seleccionar la opcin Delimitado en la
primera pregunta.

Figura 3-39

Despus de comprobar el formato de las variables, debemos comprobar si


el nombre de las variables se encuentra en la parte superior del archivo.
Para realizarlo, nos remitirnos nuevamente al visor de datos y tratamos de
detectar si en la primera fila de datos se incluyen los nombres de las
variables. Si nos fijamos en los datos, notaremos que efectivamente
los nombres de las variables son incluidos en el archivo, por lo tanto
seleccionamos la opcin Si en la segunda pregunta.

Una vez definido el formato del archivo hacemos clic en Siguiente, con lo
que aparece el cuadro de dilogo correspondiente al paso 3 [Fig.3-40]; en
este cuadro el asistente nos realiza tres preguntas sobre la forma de los
casos. La primera de las preguntas corresponde a En qu nmero de lnea
comienza el primer caso de los datos?, por defecto el programa declara la
segunda lnea como la fila de inicio de los casos, esto se debe a que en el
paso anterior le especificamos al asistente que los nombres de las variables
se encontraban en la primera fila, de lo contrario el primer caso se hallara
en la primera fila del archivo.

Figuras 3-35 y 3-36

Si nos fijamos en el visor de datos, observaremos que los nombres de las


variables han desaparecido, debido a que en el paso anterior se defini que
la primera fila corresponda a los nombres de las variables; esta nueva
visualizacin se presta para confusiones sobretodo en la primera pregunta;
sin embargo el programa no permite seleccionar la primera fila como inicio
de los casos y si intentamos ingresarel nmero uno (1) en la casilla,
aparece la leyenda La primera fila de datos debe ser al menos una, o dos si
estn presentes los nombres de las variables.

La segunda pregunta corresponde a Cmo se encuentran representados


sus casos? y nos ofrece dos opciones Cada lnea representa un caso y Un
nmero concreto de variables representa un caso (para lo cual activa una
casilla donde se especfica la cantidad de variables). Generalmente los
archivos delimitados contienen un caso por lnea; si no se tiene certeza de
cmo estn representados los casos, se debe observar la casilla visor de
datos para determinarlo.

Si los datos mantienen un orden a travs de todas las filas incluyendo


losseparadores (Tabulaciones), podemos estar seguros que las variables
estn representando un caso por fila, de lo contrario es necesario ir a la
fuente de los datos para determinarlo; es decir, acudir al creador del archivo
ya que los casos estn determinados por un nmero especfico de
variables. En nuestro caso cada fila representa un caso, por lo que
seleccionamos la primera opcin.

La tercera pregunta corresponde a Cuntos casos desea importar?. Esta


opcin nos permite limitar el nmero de casos que sern extrados del
archivo de texto. Se puede importar el total de los datos, un nmero
especifico de casos o un porcentajede los datos. Si se escoge la opcin
del porcentaje, el programa aproxima este valor al nmero entero de casos
ms cercano y los selecciona de forma aleatoria. Por defecto
esta pregunta se encuentra en la opcin Todos los casos, ya que
generalmente se importa toda la informacin del archivo. Dado que nos
interesa importar toda la informacin, mantenemos la primera opcin.

Importar Archivos Delimitados 2da Parte


Despus de seleccionar las opciones, hacemos clic en Siguiente, con lo que
aparece el cuadro de dilogo correspondiente al paso 4 [Fig.3-41]; en este
paso el asistente nos pide que le especifiquemos las propiedades de la
delimitacin de las variables, por lo que nos realiza dos preguntas. La
primera pregunta corresponde aQu delimitador se encuentra entre las
variables?. Para definir el delimitador, el programa nos ofrece cinco
posibilidades; Tabuladores, Coma, Espacio, Punto y coma y Otro.

Si seleccionamos la opcin Otro, se activa una casilla en la que se


debe ingresar el signo o carcter que se utiliz como delimitador, el cual debe
ser un carcter nico y no puede representar informacin dentro de una
variable. En el archivo deejemplo la informacin esta delimitada por
tabulaciones por lo que seleccionamos la primera opcin.

Figura 3-41

La segunda pregunta corresponde a Cul es el calificador de texto? y nos


ofrece cuatro posibles respuestas (Ninguno, Comillas simples, Comillas dobles
y Otro [Al seleccionar la opcin Otro, se habilita una casilla en la que
debemos ingresar el signo o carcter]). Este parmetro hace referencia a las
variables alfanumricas (cadena). Es posible que en algunos archivos, este tipo
de variables se encuentren precedidas de un carcter especfico; por ejemplo

Andrs Martnez;26;soltero;Ingeniero electrnico


Juan Gonzles;32;viudo;Administrador
Diana;22;casada;Ama de casa

En este caso el carcter comillas () nos indica que se trata una variable
alfanumrica. SPSS nos permite especificar cualquier carcter como
identificador, con la nica condicin que sea el mismo para todas las variables
alfanumricas.
En el archivo de ejemplo las variables alfanumricas no estn precedidas de
ningn carcter, por lo que seleccionamos la primera opcin (Ninguno). Note
como en este paso se activa el Botn Finalizar; al seleccionarlo podemos pasar
directamente al ltimo paso del asistente, por el momento no lo
seleccionaremos para poder conocer los siguientes pasos del asistente.
Adicionalmente, si nos fijamos en la parte inferior del cuadro de dilogo del
paso 4, observaremos una vista previa de los datos, en donde se expone
grficamente como esta quedando el archivo resultante, lo que es de bastante
utilidad para identificar los posibles errores que se hayan cometido en la
definicin de la informacin.

Para continuar con la extraccin de los datos hacemos clic en Siguiente, con lo
que aparece el cuadro de dilogo correspondiente al paso 5 [Fig.3-42]. En este
paso se puede modificar el nombre de las variables y el tipo al que
corresponde, as como tambin nos permite restringir las variables que se
importarn. En la parte superior del cuadro de dilogo se encuentran dos
casillas donde se debe especificar el nombre y el formato de los datos.

Para poder activar estas casillas es necesario seleccionar una variable,


haciendo clic sobre ella en la vista previa de datos. En este caso los nombres
de las variables ya estaban incluidos en el archivo de origen y por lo tanto
aparece en la parte superior de la vista previa de los datos una fila con los
diferentes nombres; en algunas ocasiones los nombres de las variables no
estn incluidos dentro del archivo de origen, por lo que es necesario
asignrselo.

Figuras 3-42 y 3-43

La segunda casilla del cuadro corresponde al Formato de datos; el programa


selecciona por defecto un tipo de formato, de acuerdo a los datos que contenga
cada variable, el nico inconveniente es que slo selecciona los
tipos Numrica yAlfanumrica (cadena). Si se desea tener informacin de otro
tipo, es necesario especificrselo al programa para lo cual se debe desplegar el
listado de formatoshaciendo clic en el botn flecha ( ) ubicado a la derecha de
la casilla formatos[Fig.3-43]. Dentro de los diferentes tipos de formatos que
podemos elegir encontramos Numrica, Cadena, Fecha/Hora, Dlar, Con
comas, Con puntos y No importar.
Para evitar importar una variable que no sea necesaria, debemos seleccionar
en elFormato de datos la opcin correspondiente a No importar. Al seleccionar
esta opcin la vista de variables no cambia, pero la informacin ser omitida
una vez terminada la importacin. Dado que las variables del archivo de datos
cuentan con el nombre y nuestro objetivo es importar la totalidad de la
informacin contenida en el archivo, no modificaremos ninguno de los
parmetros.

Importar Archivos Delimitados 3ra Parte


Para continuar con el proceso de extraccin de los datos hacemos clic
enSiguiente, con lo que aparece el cuadro de dilogo correspondiente al paso 6
[Fig.3-44]; en este cuadro se definen las opciones de guardado, ya sea de
formato o de sintaxis.

Para definir las opciones de guardado, el asistente nos realiza dos preguntas;
la primera de ellas corresponde a Desea guardar este formato de archivo para
su uso en el futuro?. Esta opcin permite aplicar la definicin de las variables
que acabamos de realizar a futuros archivos. Desde luego, estos archivos
deben contar con las mismas caractersticas del archivo delimi.txt; es decir, los
futuros archivos deben tener el mismo nmero de variables y estar ubicadas en
el mismo orden, por lo que el nmero de casos es el nico factor que puede
cambiar.

Figura 3-44

Esta opcin esta directamente relacionada con la primera pregunta encontrada


en el paso inicial del asistente [Fig.3-37], en la cual podamos aplicar un
formato predefinido al archivo. A manera de ejemplo vamos a guardar el
formato y se lo aplicaremos al mismo archivo para observar su utilidad. Para
guardar el formato debemos seleccionar primero la opcin SI, de modo que se
active el botn Guardar como; una vez se activa, hacemos clic sobre l, de
manera que aparezca la ventana de navegacin. En la casillas Buscar en,
ubicamos la carpeta Mis documentos y posteriormente le asignamos en la
casilla correspondiente el nombrePredefinido. Para finalizar hacemos clic
en Guardar con lo que la ventana de navegacin desaparece.

La segunda pregunta del cuadro de dilogo del paso 6 corresponde a Desea


guardar la sintaxis?.Al seleccionar esta opcin se abrir una ventana de
sintaxis en la cual se pegar el cdigo o palabras clave del procedimiento
importar archivo de texto. Cada vez que se selecciona la opcin pegar sintaxis
en un cuadro de dilogo, el procedimiento que estemos definiendo no se
realiza hasta que sea ejecutada la sintaxis. Por el momento no
seleccionaremos esta opcin.

La ltima opcin que aparece en este cuadro corresponde a Hacer cach de


datos en el equipo local; esta opcin es realmente til cuando estamos
trabajando con un servidor, ya que nos permite hacer una copia momentnea
de los datos, lo que reduce considerablemente el tiempo de ejecucin de cada
uno de los procedimientos realizados con el paquete. Por defecto esta opcin
se encuentra activada y para nuestro caso no la alteraremos.

Una vez terminada la definicin de los datos, hacemos clic en Finalizar, con lo
cual los datos son importados y representados en el editor de datos [Fig.3-45].
Nuevamente es necesario guardar el archivo resultante y definir las
propiedades de las variables para obtener un archivo de datos de SPSS.

Figura 3-45

Para culminar con los archivos planos o de texto en formato Delimitado, vamos
a utilizar el formato predefinido guardado en el ltimo paso; este formato lo
aplicaremos al mismo archivo para poder identificar su funcin. Para realizarlo
debemos ir al men Archivo y seleccionamos la opcin Leer datos de texto, con
lo cual se abre una ventana de navegacin, donde ubicamos el archivo
delimi.txt dentro del CD adjunto. Una vez ubicado el archivo, lo seleccionamos
y hacemos clic en Abrir, con lo que aparece nuevamente al Asistente para la
importacin de archivos de texto.

El asistente nos realiza la pregunta Se ajusta su archivo de texto a un formato


predefinido?, seleccionamos la opcin SI y posteriormente hacemos clic en el
botn Examinar, con lo que se abre una nueva ventana de navegacin [Fig.3-
46]. A travs de esta ventana ubicamos el archivo Predefinido en la carpeta Mis
documentos y posteriormente hacemos clic en abrir.

Figura 3-46

Una vez se define el archivo de formato, aparece en la casilla la ubicacin del


archivo y a su vez, se activa en la parte inferior del cuadro de dilogo el
botnFinalizar [Fig.3-47]. Al hacer clic en el botn, aparece el cuadro de dilogo
correspondiente al paso 6 de 6 [Fig.3-48]; este cuadro no presenta diferencias
significativas respecto al explicado en los prrafos anteriores, por lo que
hacemos nuevamente clic en el botn Finalizar, de modo que los datos son
representados en el Editor de datos de SPSS [Fig.3-45].

Figuras 3-47 y 3-48

Como podemos apreciar, los archivos de formato nos permiten aplicar la


definicin de los parmetros de los datos de un archivo a otro, lo que
representa un ahorro de tiempo en la importacin de los datos. Este formato se
puede aplicar a varios archivos, siempre y cuando cuenten con las mismas
caractersticas de estructura(Igual nmero de variables y en el mismo orden),
que el archivo empleado para definir la plantilla.

Importar Archivos de Texto de Ancho Fijo


Para los archivos de Ancho Fijo el paso 4, presenta diferencias en la definicin
respecto a los archivos Delimitados, debido a las caractersticas de los datos.
Para identificar estas diferencias vamos a importar los datos del
archivo ancho.dat, que se encuentra en la carpeta Captulo3 del CD adjunto.
Para abrir un archivo de texto de ancho fijo, debemos ir al men Archivo y
seleccionar la opcin Leer datos de texto, con lo que surge la ventana de
navegacin.

Por defecto, esta ventana define el Tipo de archivo en Texto (*.txt); para el
archivo de ejemplo, debemos cambiarlo al formato Datos (*.dat), por lo que
hacemos clic sobre el botn de contenido ( ) ubicado al costado derecho
de la casilla. Una vez se activa el listado de formatos, debemos seleccionar
el formato correspondiente a Datos [*.dat]. Despus de cambiar el tipo de
formato, ubicamos por medio de la casilla Buscar en,
la carpeta Captulo3 dentro de la unidad de CD, de modo que se haga
visible su contenido; dentro de ella ubicamos el archivo Ancho [Fig.3-49], lo
seleccionamos y hacemos clic en Abrir, con lo que aparece el cuadro de
dilogo del Asistente para la importacin de texto [Fig.3-50].

Figuras 3-49 y 3-50

Este cuadro contiene las mismas caractersticas del cuadro obtenido con el
archivo Delimitado, la nica diferencia que se puede resaltar se presenta en
la visualizacin del archivo. Si nos fijamos en la vista de datos, notaremos
que dentro de la informacin no aparece un carcter de separacin, por lo
que los datos de cada variable son de difcil identificacin. Dado que no se
cuenta con un archivo de formato predefinido para archivos de ancho fijo,
seleccionaremos la opcin NO y sucesivamente hacemos clic en Siguiente,
con lo que aparece el cuadro de dilogo correspondiente al paso 2 de 6
[Fig.3-51].

En este paso debemos definir las opciones de formato de los datos. Para
definirlo, el asistente nos hace la pregunta Cmo estn organizadas sus
variables?; si nos fijamos en el visor de datos, notaremos que las variables
no tienen un carcter especifico entre cada una de ellas, lo que dificulta el
reconocimiento de los datos; este suceso nos permite determinar que el
archivo corresponde al formato de ancho fijo.

La segunda pregunta del asistente corresponde a Estn incluidos los


nombres de las variables en la parte superior del archivo?, si nos fijamos
nuevamente en elvisor de datos, notaremos que los nombres no estn
incluidos en la primera fila; generalmente este tipo de archivos no incluyen
el nombre de las variables dentro de los datos, ya que esta informacin es
anexada en el libro de variables o diccionariode datos, el cual debe ser
proporcionado por el autor del archivo y en donde se especifican los
parmetros correspondientes a cada variable, como el ancho, el nombre, los
valores, las categoras, etc. Para continuar con la extraccin, activamos
la opcin Ancho fijo en la primera pregunta y la opcin No en la
segunda.

Figuras 3-51 y 3-52

Una vez determinado el formato del archivo hacemos clic en Siguiente, con
lo que aparece el cuadro de dilogo correspondiente al paso 3 de 6 [Fig.3-
52], en este paso se definen las opciones de los casos. Dentro de estas
opciones encontramosEn qu nmero de lnea comienza el primer caso de
los datos?, Cuntas lneas representan un caso? y Cuntos casos desea
importar?.

La primera fila de datos debe ser por lgica el lugar en donde comiencen los
datos, ya que en el paso anterior definimos que los nombres de las
variables no se incluan en la primera fila. Para determinar cuantas filas
representan un caso, es necesario dirigirnos al final de las lneas empleando
la barra de desplazamiento horizontal que aparece en la vista previa de
datos y tratar de observar si cada una de las filas cuenta con un longitud
aproximadamente igual, de lo contrario es indispensable recurrir al libro de
variables; en nuestro ejemplo cada fila representa un caso.

Despus de establecer las opciones de los casos hacemos clic


en Siguiente, con lo que aparece el cuadro de dilogo correspondiente al
paso 4 de 6 [Fig.3-53], en donde se definen las posiciones de las variables.
En este paso se hacen evidentes las diferencias entre los
dos formatos (Delimitado y Ancho fijo). SPSS suele utilizar lneas de corte
para definir el ancho de cada variable, ubicando una lnea en la columna de
inicio y otra al finalizar la variable. Cada una de estas lneas debe ser
ingresada por el usuario, ya que el programa no tiene la capacidad de
identificar las variables.
Figura 3-53

Si nos fijamos en la parte superior del cuadro, notaremos que aparecen las
instrucciones de cmo utilizar las lneas de corte; dentro de
estas instruccionesencontramos los procedimientos de como modificar
insertar o eliminar lneas. Las lneas deben ser ingresadas y editadas en la
vista previa de datos; para facilitar la ubicacin de cada lnea, el asistente
incluye un indicador de columna en la parte superior de la Vista previa de
datos, el cual esta estipulado de 10 en 10 y con unas marcas de
identificacin para cada nmero de lnea intermedio [Fig.3-54].

Figura 3-54

Note como cada una de las marcas de indicacin se ubican directamente en


la zona intermedia de cada uno de los datos. Para ingresar una nueva lnea,
se debe ubicar el puntero del ratn entre dos valores de datos y hacer clic,
con lo que aparece en la zona intermedia una nueva lnea. Para eliminar
una lnea, basta con hacer clic en la punta de la flecha, con lo cual
desaparece. Para mover una lnea, se debe seleccionar haciendo clic sobre
ella y manteniendo el botn del ratn oprimido correrla hasta el lugar donde
se desee ubicar; al soltar el botn del ratn la lnea se queda esttica.

Para aclarar la forma en que se deben definir el ancho de las variables,


vamos a delimitar en la proxima leccin seis de las variables incluidas en el
archivo.

Importar Texto de Ancho Fijo 2da Parte


Antes de ingresar las lneas de corte, es necesario conocer como estn
estipuladas las variables en el archivo, por lo que debemos recurrir al libro de
variables odiccionario de datos. Para disminuir el tamao del diccionario de
datos, slo expondremos la informacin perteneciente a las seis variables de
inters; esta informacin se encuentra en la tabla de la figura [3-55].

Si nos fijamos en los datos de la tabla, notaremos que las variables que
extraeremos corresponden al nmero de encuesta (Columnas de la 1 a la 4),
Ciudad (columna 2), Gnero (columna 6), Edad (columnas 9 y 10), Estado civil
(columna 28) y Nivel de educacin (Columna 30). Esta informacin debe ser
generada por el creador del archivo, aunque algunos programas la
proporcionan en el momento de formarlo. Para entender la posicin de forma
ms clara observemos la figura [3-56], en la cual aparece el nmero de la
columna en la parte superior.

Figura 3-55

Figura 3-56

Una vez establecidas cada una de las columnas que ocupan las variables,
debemos introducir en la vista previa de datos las lneas de corte
correspondientes al inicio y el final de cada variable de inters. Los datos
ubicados en las columnas 7 y 8, 11 a 27 y las superiores a 30 no se deben
considerar como informacin prdida, ya que estas columnas corresponden a
variables que no deseamos importar y por lo tanto las omitimos en la tabla
del diccionario de datos. Continuando con ejemplo, procedemos a introducir las
lneas de corte correspondientes a cada una de las variables de inters.

Para realizarlo, debemos insertar una lnea entre las columnas 4 y 5, otra entre
las columnas 5 y 6, otra entre las columnas 6 y 7, otra entre las columnas 8 y 9,
otra entre las columnas 10 y 11, otra entre las columnas 27 y 28, otra entre las
columnas 28 y 29, una ms entre las columnas 29 y 30 y la ltima lnea entre
las columnas 30 y 31; as mismo debemos borrar las lneas de las columnas
17, 24 y 32. Despus deingresar todas las lneas de corte, debemos obtener
los resultados de la figura [3-57].
Figura 3-57

Una vez definidas las lneas de corte para cada una de las variables hacemos
clic en Siguiente, con lo que aparece el cuadro de dilogo correspondiente al
paso 5 de 6 [Fig.3-58]. En este paso debemos definir el nombre y el formato de
cada una de las variables, as como especificar las variables que deseamos
importar.

Si nos fijamos en la vista previa de datos, notaremos que el programa a


reconocido diez (10) diferentes variables, las cuales identifica con la letra V y le
asigna un nmero de acuerdo a la ubicacin que tenga dentro del archivo (V1,
V2, V3,..., V10). Para continuar con la extraccin de los datos, vamos a definir
el nombre y el formato de datos para las variables de inters. Con el nimo de
facilitar la interpretacin de los nombres y formatos, se anexa la tabla de la
figura [3-59]; en esta tabla encontramos la ubicacin de la variable (V1, V2,
etc.), el nombre que le asignaremos y el formato al que corresponde.

Figuras 3-58 y 3-59

Para ingresar las propiedades debemos hacer clic sobre la columna de la


variable en la vista previa de datos, de manera que se resalte toda la columna.
Una vez se resalta, vamos a la casilla Nombre e ingresamos las letras que le
corresponden; posteriormente activamos la casilla Formatos y elegimos
del listado el formato correspondiente. Despus de definir la primera variable,
debemos seleccionar en la vista previa de datos la segunda variable, con lo
que el nombre definido para la primera variable aparece en la parte superior de
la vista [Fig.3-60].
Figuras 3-60 y 3-61

Las variables V4, V6, V8 y V10, no las importaremos ya que contienen


informacin que no requerimos. Para evitar que estas variables
sean importadas, es necesario especificrselo al programa, por lo que
debemos sealarlas y en la casilla formatosescoger la opcin No
importar [Fig.3-61]. Este procedimiento debe realizarse con cada una de las
variables que no deseamos importar.

Despus de asignarle el nombre y el formato a cada una de las variables de


inters y definir las variables que no deseamos importar, hacemos clic en el
botnSiguiente con lo que aparece el cuadro de dilogo correspondiente al
paso 6 de 6 [Fig.3-62]. Este cuadro es igual al generado para las variables
delimitadas. Si nos fijamos en la vista previa de datos observaremos que las
variables V4, V6, V8 y V10, aun estn presentes, esto se debe a que el
programa no ejecuta la importacin hasta hacer clic en Finalizar. Para terminar
la importacin hacemos clic en finalizar de manera que la informacin aparece
en el editor de datos [Fig.3-63].

Figuras 3-62 y 3-63

En conclusin los archivos de texto de Ancho fijo son ms complejos y su


definicin requiere de mayor esfuerzo; sin embargo, este tipo de archivos son
muy comunes debido en gran medida a su reducido tamao y la optimizacin
del espacio, adems la mayora de los programas para la captura de datos,
suelen generar archivos de este formato. Al igual que en las importaciones de
datos anteriores, es necesario guardar la informacin y definir las propiedades
de las variables antes de obtener un archivo de datos completo.

Importar Bases de Datos a SPSS


De igual manera que en los formatos anteriores, SPSS nos permite importar
informacin procedente de diferentes programas de bases de datos como
Access, Foxpro, dBase, etc. Con la nica condicin que el programa sea
compatible con los controladores ODBC. Para comprender la metodologa que
se debe emplear en la importacin de informacin proveniente de archivos de
Bases de datos, vamos a Extraer la informacin del
archivo Basetelemerca.mdb, incluido en la carpetaCaptulo3 del CD adjunto.

Para importar la informacin de los archivos de bases de datos, debemos ir al


men Archivo y seleccionar la opcin Abrir bases de datos [Fig.3-64], donde
encontraremos tres posibilidades Nueva consulta (Esta opcin nos permite
definir la fuente [Programa y Nombre del archivo] y los datos [Variables y
casos], del archivo de origen); Editar consulta (Con esta opcin podemos
modificar los parmetros de una consulta creada con anterioridad);
y Ejecutar consulta (esta opcin nos permite importar de forma directa la
informacin de un archivo, utilizando los parmetros establecidos en una
consulta previamente creada).

Para poder utilizar las opciones Editar y Ejecutar es necesario haber definido y
guardado una consulta con anterioridad. Dado que es la primera vez que
trabajamos con archivos de base de datos debemos crear una nueva consulta,
por lo tanto escogemos la primera opcin, con lo cual se abre el cuadro de
dilogo correspondiente al Asistente para bases de datos [Fig.3-65], quien nos
guiar durante todo el proceso de definicin de los datos.

Figuras 3-64 y 3-65

Este asistente se compone de seis pasos, a travs de los cuales se definen las
caractersticas de la informacin contenida en el archivo. En el primer paso
debemos especificar el origen o fuente de los datos; es decir, determinar el
nombre del archivo de inters y el programa que lo gener. Si nos fijamos en el
costado derecho del cuadro de dilogo, observaremos una lista de fuentes, en
donde aparecen todos los tipos de bases de datos con que cuenta nuestro
ordenador. Estos formatos son los accesos a los controladores de base de
datos que se encuentran instalados en el equipo.

Para especificar el origen de los datos, SPSS nos ofrece dos posibilidades; la
primera es aadir una nueva fuente de datos y la segunda es elegir una de las
fuentes existentes en el listado de formatos. A pesar que SPSS incluye dentro
del CD de instalacin, una gran cantidad de controladores (SPSS Data Access
Pack), es posible que no se encuentre dentro del listado
de formatos el controladorcorrespondiente al archivo de inters.

Para subsanar este tipo de sucesos, es necesario que el usuario defina de


formamanual el controlador al que corresponde el archivo; para comprender los
pasos que se deben ejecutar en esta tarea vamos a definir una nueva fuente de
datos con el archivo de ejemplo. Antes de continuar, es necesario aclarar que
SPSS no requiere la instalacin del programa de origen en el ordenador, si no
la instalacin del controlador, el cual es facilitado por el fabricante dentro del
CD de instalacin o se puede encontrar en la pgina Web oficial de la empresa
que lo produzca.

Para definir una nueva fuente de datos, debemos hacer clic en el botn Aadir
fuente de datos, con lo que surge un nuevo cuadro de dilogo denominado
Administrador de orgenes de datos ODBC [Fig.3-66]; esta aplicacin no hace
parte del paquete SPSS, sino que es una funcin del sistema operativo
Windows.

Est administrador se utiliza para definir el nombre del archivo y el programa de


origen, pero requiere que el controlador ya se encuentre instalado en el
ordenador. Para instalar un controlador nuevo es necesario utilizar el programa
de instalacin diseado por el fabricante, el cual se incluye dentro del paquete
del controlador (si quieres profundizar sobre este tema debes utilizar el sistema
de Ayuda de Windows).

El administrador esta compuesto por siete opciones; cada una de ellas se


utiliza dependiendo de las caractersticas del archivo. Por el momento nos
concentraremos en la pestaa DSN de usuario donde se agregan, eliminan o
configuran los orgenes de datos locales, a los cuales slo se puede tener
acceso si los datos se encuentran en alguno de los discos duros o extrables
del equipo.

Figuras 3-66 y 3-67

Para continuar con el ejemplo vamos a definir el


archivo Basetelemerca.mdb como un nuevo origen de datos; para lograrlo,
debemos hacer clic en el botn Agregar de la pestaa DSN de usuario, con lo
que aparece el cuadro de dilogo correspondiente a Crear nuevo origen de
datos (Fig.3-67). En este cuadro encontramos un listado de los controladores
de bases de datos con que cuenta nuestro ordenador (el listado puede variar
de acuerdo al nmero de controladores que se tengan instalados).

Dentro de este listado vamos a ubicar el controlador correspondiente


a Microsoft Access Driver (*.mdb), el cual como su nombre lo indica, nos
permite abrir los archivos creados en Microsoft Access. En la siguiente leccin
continuaremos con la importacin de Informacin proveniente de Bases de
Datos.

Importar Bases de Datos a SPSS 2da Parte


Dentro de este listado vamos a ubicar el controlador correspondiente
a Microsoft Access Driver (*.mdb), el cual como su nombre lo indica, nos
permite abrir los archivos creados en Microsoft Access. Despus de ubicarlo, lo
seleccionamos y posteriormente hacemos clic en Finalizar; con lo que aparece
el cuadro de dilogo correspondiente a Configuracin de ODBC Microsoft
Access [Fig.3-68].

En este cuadro se definen las propiedades de la fuente, como el Nombre del


origen de datos, la Descripcin y la base de datos. La primera de estas
propiedades, nos permite asignarle un nombre a la fuente de datos que
estamos creando, con el fin de facilitar su reconocimiento dentro del listado.
Para continuarcon el ejemplo le asignaremos el nombre Base.

La segunda propiedad (Descripcin), nos permite generar una pequea


leyenda para describir brevemente el contenido del archivo; esta descripcin es
un parmetro informativo para los futuros usuarios de esta consulta, donde le
indicar que tipo de datos se encuentran dentro de la informacin.
Para continuar con el ejemplo ingresaremos la frase Contactos telemercadeo.

Figuras 3-68 y 3-69

Dentro de las propiedades de bases de datos encontramos cuatro opciones


(Seleccionar, Crear, Reparar y Compactar), cada una de ellas genera un nuevo
cuadro de dilogo especfico cuya nica diferencia con respecto a los dems
radica en la funcin que realiza. Si deseamos conocer una pequea
descripcin de la funcin de cada una de las opciones, debemos hacer clic
derecho sobre el botn de inters, con lo que aparece una leyenda informativa
[Fig.3-69].
Para continuar con el ejemplo hacemos clic en botn Seleccionar; con lo que
aparece una nueva ventana de navegacin, la cual emplearemos para ubicar el
archivo Basetelemerca.mdb en la carpeta Captulo3 del CD adjunto. Una vez
localizado, lo seleccionamos y hacemos clic en Aceptar con lo que aparecer
en la parte superior de la seccin Base de datos el nombre y la ubicacin del
archivo [Fig.3-70]. Note como despus de definir el archivo de origen, se activa
el botnAceptar.

Figuras 3-70 y 3-71

Para terminar hacemos clic en l, de modo que volvemos al Administrador de


orgenes de datos [Fig.3-71]; en donde aparece la consulta que hemos creado
con el nombre que le estipulamos (Base), si nos fijamos en
el controlador observaremos que aparece Microsoft Access Driver(*.mdb); lo
que nos indica que este es un acceso directo a la lectura del
archivo Basetelemerca creado en Access.

Para terminar la definicin de la nueva fuente de datos hacemos clic


en Aceptar, con lo que volvemos al Asistente para bases de datos de
SPSS [Fig.3-72]. Si nos fijamos en listado de fuentes del asistente,
observaremos que ahora aparece el origen de datos que acabamos de crear
(Base). Para empezar con la definicin de los datos (Variables y Casos), slo
debemos seleccionar la fuente de datos haciendo clic sobre ella, de modo que
se resalte y posteriormente hacer clic en el botn Siguiente, con lo que
pasaramos al cuadro de dilogo correspondiente al paso 2 de 6. Antes
de continuar conoceremos el segundo mtodo que emplea SPSS para definir
los orgenes de datos; si ya pasaste al segundo paso, debes hacer clic en el
botn Atrs.

Figuras 3-72 y 3-73


La segunda opcin que nos ofrece SPSS para definir el origen de datos, es
mucho ms sencilla. Este mtodo slo es aplicable si aparece en
el listado de formatos, el acceso al controlador del programa en que se origino
el archivo. Para conocer el segundo mtodo de apertura de base de datos,
vamos a ubicar dentro del listadode formatos el acceso al controlador Microsoft
Access Database. Una vez ubicado hacemos doble clic sobre l, de manera
que aparezca la ventana Acceso alcontrolador ODBC [Fig.3-73].

En este cuadro hacemos clic en el botn Examinar, con lo que surge una nueva
ventana de navegacin, por medio de la cual ubicamos el
archivoBasetelemerca.mdb en la carpeta Captulo3 incluida en el CD adjunto.
Despus de localizar el archivo, lo seleccionamos y hacemos clic en Abrir, de
manera que desaparece la ventana de navegacin y surge en la casilla Base
de datos la ruta de ubicacin del archivo. Para finalizar hacemos clic
en Aceptar apareciendo el cuadro de dilogo correspondiente al paso 2 de 6
[Fig.3-74]. En este paso debemos definir las variables de las
diferentes tablas del archivo que deseamos importar.

Figuras 3-74 y 3-75

Este cuadro de dilogo esta dividido en dos secciones; la primera de ellas


corresponde a la lista de elementos (Tablas disponibles), en donde
encontramos todas las tablas con que cuenta el archivo; cada tabla esta
precedida de un icono ( ), que facilita su identificacin. Para poder observar
las variables con que cuenta cada tabla, es necesario desplegar su contenido
haciendo clic en el icono suma ( ) que se encuentra al costado izquierdo de la
tabla. Al desplegar el contenido de la tabla, aparecen todas las variables en la
lista de elementos [Fig.3-75].

En la siguiente leccin continuaremos con la importacion de informacin


proveniente de Bases de Datos en SPSS.

Importar Bases de Datos a SPSS 3ra Parte


La segunda seccin del cuadro la compone la lista de recuperacin de campos,
en esta casilla se visualizan las variables que han sido seleccionadas para la
importacin; para seleccionar una variable basta con hacer doble clic sobre la
variable o llevar el puntero del ratn a la lista de campos, hacer clic sobre la
variable de inters y manteniendo el botn oprimido, arrastrarla hasta la casilla
de recuperacin de campos donde soltamos el botn y aparece la variable
seleccionada [Fig.3-76].

Figura 3-76

Si nos fijamos en la casilla de recuperacin, observaremos que la variable esta


precedida de la tabla a la que corresponde (en este caso Contactos:). Si
queremos seleccionar todas las variables de una tabla debemos seleccionar la
tabla y llevarla a la casilla de recuperacin de campos, con lo cual todas las
variables que contenga sern ingresadas.

Para continuar con el ejemplo vamos a seleccionar todas las variables de


las tablasContactos y Tipos de contactos; para realizarlo debemos hacer
doble clic sobre las dos tablas, de manera que aparezcan en la casilla de
recuperacin todas las variables que contienen [Fig.3-77]. Despus
de ingresar las variables hacemos clicen Siguiente con lo que aparece el
cuadro de dilogo correspondiente al paso 3 de 6 [Fig.3-78]; en este paso
debemos definir la relacin existente entre las variables de las dos tablas.

Figuras 3-77 y 3-78

Por defecto el programa relaciona las variables que tengan el mismo nombre
en las dos tablas; las variables restantes deben ser relacionadas en
forma manual por el usuario. La utilidad de este paso radica en la posibilidad
de restringir dos variables con el mismo contenido pero con nombres diferentes
en las dos tablas.
La otra opcin que nos ofrece este paso la encontramos en la parte inferior del
cuadro y corresponde a Unir tablas automticamente. Esta opcin por defecto
se encuentra activa y su utilidad radica en formar como resultado un slo
archivo de datos. Dado que en nuestro caso las variables restantes no tienen
ningn tipo de relacin y la opcin unir tablas se encuentra activa,
hacemos clic en Siguiente con lo que aparece el cuadro de dilogo
correspondiente al paso 4 de 6 [Fig.3-79].

En este paso el asistente nos brinda la posibilidad de limitar la informacin de


las variables que ser importada, mediante dos mtodos diferentes. El primero
de ellos, consisten en restringir los casos por medio de ecuaciones de
comparacin (Aritmtico lgicas) y la segunda opcin es por medio del
muestreo aleatorio.

Figura 3-79

Si deseamos definir una o varias funciones de comparacin, es necesario


ingresarlas en la seccin Criterios, cumpliendo con los requisitos estipulados
por SPSS para cada uno de los campos. Dentro de los criterios de
comparacin encontramos;

Expresin 1 en este campo se introduce un valor numrico o una de las


variables del archivo.
Relacin, es una funcin matemtica de comparacin entre dos
expresiones; podemos utilizar relaciones como igual (=); menor que (<),
mayor que (>), menor o igual que (<=), mayor o igual que (>=) y diferente
de (<>).
Expresin 2 en este campo se introduce un valor numrico o una de las
variables, teniendo en cuenta que la comparacin entre dos nmeros no
es de utilidad.
Conector, este campo une la relacin (Expresion1 + Relacin +
Expresin2) ubicada en su fila con la relacin de la fila inmediatamente
anterior; por este motivo la primera casilla de los conectores no esta
habilitada. En las ecuaciones podemos utilizar dos tipos de conectores
correspondientes a la funcione lgicas AND (Y) OR (O).

Para entender mejor el funcionamiento de estos parmetros, en la proxima


leccin limitaremos la recuperacin de casos de la base de datos de ejemplo.
Importar Bases de Datos a SPSS Fin
Vamos a pedirle al asistente que slo importe los casos que satisfagan la
condicin (empresas comercializadoras cuyo contacto no sea a travs de
referidos). Para poder ingresar los criterios de seleccin es indispensable
conocer el contenido de la base de datos; es decir, sus variables y los
valores que pueden tomar.

Generalmente el diseo de las bases es efectuado por el departamento de


sistemas, en donde se le asignan los nombres y los valores representativos a
cada variable; para poder comprender el contenido de las bases es
indispensable tener un diccionario de datos en el que se especifiquen estos
parmetros. No entraremos en detalle sobre el contenido de la base de
ejemplo, ya que el objetivo es conocer la forma de importar la informacin
mediante el Asistente para bases de datos.

Lo primero que debemos hacer es identificar las variables que se involucran en


el criterio de seleccin; en nuestro caso emplearemos las
variables IdTipoContacto yTipo de cuenta. La variable IdTipoContacto tiene 2
valores representativos (Referido = 1 y Telemercadeo = 2); mientras que la
variable Tipo de cuenta puede tomar los valores (Comercializadora = COM,
Manufactura = MANU Y Financiera = FIN). Note que los datos en esta variable
corresponde a letras, esto se debe a que dentro del archivo original se
definieron estos valores.

Teniendo en cuenta los valores que pueden tomar cada una de las variables, la
expresin debe quedar (IdTipoContacto > 1 AND Tipo de cuenta = COM). En
esta expresin, el conector AND acta como un limitante, ya que le indica al
programa que slo importe los casos que cumplan las dos condiciones; es
decir, nicamente importe los casos correspondientes a las empresas
comercializadores cuyo contacto no haya sido a travs de referidos.

Para introducir la ecuacin, debemos hacer clic en la primera casilla de la


columnaExpresin 1, al activarse aparece al costado derecho el botn de
contenido ( ) con el cual desplegamos la lista de variables y escogemos la
variable IdTipoContacto[Fig.3-80]. Despus de definir la variable, pasamos a la
casilla Relacin y escogemos de la lista la funcin (>); en la cacilla Expresin
2 introducimos el valor uno (Nmero1).

Terminada la primera fila proseguimos a la segunda y en la


casilla Conectorescogemos la opcin AND (Y); en la casilla Expresin
1 (segunda fila) elegimos de la lista la variable Tipo de cuenta, en la
casilla Relacin el operador igual (=) y en la casilla de Expresin 2 introducimos
el valor COM (en maysculas); con lo cual la ecuacin debe quedar igual a la
figura [3-81].
Figuras 3-80 y 3-81

SPSS tambin nos permite limitar la recuperacin de casos por medio de un


muestreo aleatorio, ya sea por medio de un porcentaje o un nmero especifico
de casos. Esta opcin puede ser utilizada junto a los criterios de seleccin o
directamente sobre el total de los casos.

Por el momento no emplearemos el muestreo aleatorio, por lo que hacemos


clic enSiguiente de manera aparece el cuadro de dilogo correspondiente al
paso 5 de 6 [Fig.3-82], donde definiremos los nombres y tipos de variables. En
este cuadro encontramos tres columnas; la primera corresponde al nombre de
la variable de resultado, por medio de estas casillas podemos ingresarle un
nombre a cada una de las variables, teniendo en cuenta que cumplan con los
parmetros establecidos por el programa para los nombres.

La segunda columna corresponde al tipo de variable, donde podemos


especificar el tipo de informacin que contiene cada variable; por defecto el
programa nos sugiere el tipo que considera adecuado para cada variable. Por
ltimo encontramos la columna etiquetas de valor en donde al programa nos
permite convertir los valores de una variable alfanumrica (Cadena), en
etiquetas de valor; el programa asignar los valores de la variable de acuerdo
al orden alfabtico de las categoras que contiene y toma como etiqueta de
valor la frase a la que corresponde. Esta opcin slo debe utilizarse cuando las
variables de cadena contienen menos de diez posibles categoras.

Figuras 3-82 y 3-83

Para continuar con el ejemplo, elegiremos la opcin Etiquetas de valor para las
variables Tipo de contacto, tipo de cuenta, Ciudad, Volumen y Cargo, para lo
que debemos hacer clic en la casilla que se ubica al costado de cada variable,
de manera que aparezca en la casilla un visto bueno ( ). Una vez activadas
las etiquetas de valor para las variables hacemos clic en Siguiente con lo que
aparece el cuadro de dilogo correspondiente al paso 6 de 6 [Fig.3-83], en
donde hallamos las opciones de resultados.

Este cuadro esta dividido en tres secciones; la primera corresponde a las lneas
de comando SQL que se han generado para el intercambio de informacin
desde la base da datos hasta SPSS. La segunda seccin corresponde a
las opciones deconsulta, en donde el asistente nos hace la pregunta Qu le
gustara hacer con esta consulta? y nos brinda la posibilidad de importar los
casos o pegar la sintaxis para modificarla posteriormente. Debemos recordar
que si le pedimos que pegue la sintaxis no importara los datos hasta que se
ejecute dicha sintaxis; para agilizarel proceso, seleccionamos la
opcin Recupere los casos.

La tercera seccin corresponde a la opcin de guardado, en donde le podemos


especificar al programa que guarde la consulta que acabamos de definir, para
trabajar con ella en futuras sesiones. Para conocer su utilidad vamos a guardar
laconsulta en la carpeta Mis documentos con el nombre Ejemplo; para
realizarlo, debemos hacer clic en el botn Examinar, de manera que aparezca
la ventana de navegacin a travs de la cual ubicamos la carpeta Mis
documentos en la unidad [C:] y posteriormente le asignamos el nombre
Ejemplo.

Despus de pedirle al asistente que recupere los casos y guardar la consulta,


hacemos clic en el botn Finalizar, con lo que la importacin se realiza y los
datos son expuestos en el editor de datos de SPSS [Fig.3-84]. Al igual que los
ejemplos anteriores, es necesario guardar el archivo resultante y definir
las propiedades de las variables, antes de obtener un archivo de datos
completo.

Figura 3-84
Para finalizar con la importacin de archivos de bases de datos, vamos a
utilizar laconsulta que hemos guardado en el ltimo paso. Para realizarlo nos
dirigimos al men Archivo, escogemos la opcin Abrir base de datos y dentro
de ella seleccionamos la opcin Ejecutar consulta, con lo que se abre una
nueva ventana de navegacin [Fig.3-85].

Figura 3-85

Por medio de esta ventana ubicamos el archivo Ejemplo.spq dentro de la


carpetaMis documentos y posteriormente hacemos clic en Abrir con lo que la
informacin ser importada y representada en el editor de datos. La utilidad de
guardar lasconsultas radica en la posibilidad de importar la informacin
actualizada de unabase de datos, de forma directa sin necesidad de definir
nuevamente todos los parmetros del archivo.

Definiendo Propiedades de Variables en SPSS


Despus de importar la informacin contenida en archivos de Texto, Hojas de
clculo o Bases de datos, es necesario definir las propiedades de las variables
para poder obtener un archivo de datos completo. Para esta labor SPSS cuenta
con dos procedimientos que nos permiten especificar rpidamente todas las
variables de un archivo, a travs de un asistente que nos orienta durante
todo el proceso.

El primero de estos procedimientos corresponde a Definir propiedades de


variables el cual nos permite declarar las propiedades de cada una de las
variables de un archivo, a travs de un solo cuadro de dilogo. El
segundo procedimientocorresponde a Copiar propiedades de datos; por
medio de esta aplicacin, podemos extraer las propiedades de un archivo
previamente definido y sucesivamente incorporrselas a otro. Para facilitar
la interpretacin de estos procedimientos, vamos a generar un ejemplo con
cada uno de ellos, con el fin de exponer su metodologa y sus alcances.
Definir Propiedades de Variables
Antes de emplear este procedimiento, es necesario contar con un archivo
abierto en el editor de datos de SPSS. Para generar la declaracin
de propiedades, vamos a emplear el archivo de datos obtenido a travs del
ejemplo de la importacin de informacin proveniente de Hojas de clculo
(apartado 3.2.1), el cual guardamos en la carpeta Mis documentos bajo el
nombre de infodatos.sav. Si por alguna razn no guardaste el archivo o
simplemente no recuerdas donde esta ubicado, este mismo archivo se
encuentra en la carpeta Captulo3 incluida en el CD adjunto.

Para abrir el archivo nos dirigimos al men Archivo, seleccionamos la


aplicacinAbrir y dentro de ella la opcin Datos, con lo que surge una nueva
ventana de navegacin, la cual empleamos para ubicar el archivo. Una vez
ubicado, lo seleccionamos y hacemos clic en Abrir, de manera que su
contenido aparezca en el Editor de datos de SPSS. Para poder acceder
al procedimiento, debemos dirigirnos al men Datos y seleccionar la
opcin Definir propiedades de variables[Fig.3-86]; al hacer clic sobre ella,
aparece el cuadro de dilogo inicial [Fig.3-87], en donde debemos
especificar las variables que sern definidas.

Figuras 3-86 y 3-87

Este cuadro esta dividido en dos casillas; la primera corresponde a la lista


de variables, en donde encontramos todas las variables con que cuenta el
archivo. La segunda corresponde a la casilla de seleccin; en donde se
deben ingresar las variables a las que deseamos realizar la definicin de
las propiedades. Adems de las casillas, el cuadro anexa en la parte inferior
las opciones Limitar el nmero de casos explorados a y Limitar nmero de
valores mostrados a, las cuales hacen referencia a la esencia
del procedimiento.

Para proporcionarnos una orientacin sobre el tipo de variable, el programa


realiza una exploracin de los datos incluidos en cada una de las variables
seleccionadas y nos ensea un listado de los valores encontrados, as como
los parmetros actuales de cada una de las propiedades. Este mtodo
constituye la herramienta principal que emplea el programa para determinar
el nivel de medida ms adecuado. Estas opciones nos permiten delimitar en
su orden, el nmero de casos que se emplean en la exploracin y el nmero
mximo de valores que aparecern en los resultados de la exploracin.

Continuando con el ejemplo seleccionamos las variables Clasesoc, Edad, y


Gnero; para efectuarlo, debemos activar cada una de las variables
haciendo clic sobre ella en la lista y sucesivamente hacer clic en el
botn Flecha ( ) ubicado en el medio de las dos casillas. Una vez
ingresadas las variables obtenemos los resultados de la figura [3-88]. Note
como al ingresar la primera de las variables se activa el botn Continuar;
esto se debe a que el programa requiere que se seleccione por lo menos
una variable. Para proseguir con la definicin de las variables hacemos clic
en Continuar, de manera que aparece el cuadro de dilogo principal
del procedimiento [Fig.3-89]. En este cuadro se definen cada uno de los
parmetros estipulados por SPSS, para las variables seleccionadas.

Figuras 3-88 y 3-89

Si nos fijamos en la figura [3-89], notaremos que el cuadro se encuentra


dividido en cinco (5) secciones. La primera de ellas corresponde a la Lista
de variables, en donde aparecen las variables que hayan sido
seleccionadas para la exploracin en el paso anterior. Para activar cada una
de las casillas de la ventana, es necesario seleccionar una de las variables
haciendo clic sobre ella en el listado. La segunda seccin del cuadro
corresponde a Lmites; en esta seccin encontramos unresumen del
nmero de casos explorados, as como el nmero mximo de valores que
aparecern por variable.

La tercera divisin corresponde a las Propiedades de las variables; en esta


seccin se localizan los principales parmetros de definicin como
el Nombre, laEtiqueta, el Nivel de medida, el Tipo de variable, el Ancho,
los Decimales, as como tambin la casilla valores sin etiqueta, la cual nos
indica el nmero de valores que no cuentan con una etiqueta definida [Fig.3-
90].
Figura 3-90

Si nos fijamos en la casilla del nivel de medida, notaremos que junto a ella
se encuentra el botn Sugerir; al activar este botn, el programa nos brinda
una sugerencia sobre el nivel de medida ms adecuado para la variable
seleccionada, de acuerdo a los valores encontrados en la exploracin de los
datos.

La cuarta seccin del cuadro corresponde a la Casilla de valores [Fig.3-91];


en esta rea se localizan las
columnas Cambiado, Perdido, Recuento, Valor y Etiqueta, cada una de ellas
cumple un objetivo especfico y le proporciona al programa indicaciones de
los cambios que se deben realizar. La columna Cambiado nos indica si uno
de los valores a sufrido modificaciones en el valor, la etiqueta o si ha sido
definido como perdido.

Figura 3-91

La casilla Perdido nos permite definir uno o varios de los nmeros


encontrados en la variable como valores perdidos por el usuario; debemos
recordar que un valor perdido definido por el usuario es una razn por la
cual no obtuve informacin y por lo tanto, no ser incluido en los clculos
que se realicen con la variable. La columnaRecuento corresponde al
nmero de veces que se encuentra cada valor dentro de los datos. La
columna valor nos indica los diferentes nmeros que toman los datos dentro
de la variable. Por ltimo encontramos la columna Etiquetas, la cual
podemos emplear para ingresar una leyenda descriptiva que identifique
cada uno de los valores de la variable en los resultados, con la condicin
que no exceda la longitud mxima de 60 caracteres.

La ltima seccin del cuadro corresponde a los Botones de opcin [Fig.3-


92]; a travs de estos botones podemos aplicar las propiedades que
estamos definiendo a una o mltiples variables del archivo (A otras
variables...) o copiar laspropiedades de una variable a la variable que
estamos definiendo (De otra variable...). De igual manera podemos pedirle
al programa que genere las etiquetas de valor de forma automtica a una
variable, para lo cual el programa asigna un nmero a cada uno de los
valores que aparezcan en los datos. Esta opcin es de gran utilidad cuando
trabajamos con variables Alfanumricas (Cadena), ya que el programa
automticamente se encarga de asignar los valores de acuerdo al orden
alfabtico de los datos.

Figura 3-92

Para comprender mejor el funcionamiento de los componentes


del procedimiento, vamos a realizar en la siguente leccin la definicin de
las variables seleccionadas.

Definiendo Propiedades de Variables 2da


Parte
Para comprender mejor el funcionamiento de los componentes del
procedimiento, vamos a realizar la definicin de las variables seleccionadas.
Para efectuarlo, es necesario conocer de ante mano los datos ms relevantes
de cada variable como el nombre, la etiqueta y las categoras que representa
cada valor. En la tabla de la figura [3-93], se anexa esta informacin para cada
una de las variables de inters. Generalmente esta informacin debe ser
proporcionada por el autor del archivo, dentro
del documento denominado diccionario de datos.

Figura 3-93

Para iniciar la definicin de las propiedades, debemos seleccionar en la lista la


variable Clasesoc haciendo clic sobre ella. Una vez se activan las casillas del
cuadro, nos dirigimos a la casilla Etiqueta e ingresamos la frase Clase social
del encuestado; sucesivamente ingresamos en la casilla Ancho el valor uno (1)
y mantenemos el valor de los decimales en cero (0).

A continuacin nos dirigimos a la casilla de valor y en la


columna Etiquetaingresamos las leyendas para cada valor. Al nmero uno (1)
le ingresamos la leyenda Alta, al nmero dos (2) la frase Media, al valor tres (3)
la frase trabajadora, al nmero cuatro (4) la frase Baja y al nmero nueve (9) la
leyenda No responde. Despus de definir las etiquetas nos dirigimos a la
columna Perdido y activamos la casilla del nmero nueve (9) de modo que
obtenemos los resultados de la figura [3-94].
Note como al ingresar cada una de las etiquetas de valor se activa la casilla de
la Columna cambiado, la cual es una medida de control que nos indica los
valores que han sido modificados; as mismo si nos fijamos en la lista de
variables, notaremos que despus de definir la etiqueta para todos los valores
desaparece la equis del cuadro que acompaa la variable, este icono nos
indica que no queda ningn valor sin editar y lo podemos comprobar
observando la opcin Variables sin etiquetas.

Figuras 3-94 y 3-95

Para finalizar la definicin de esta variable slo nos queda faltando la propiedad
Nivel de medida. Si hacemos clic en el botn Sugerir que se encuentra al
costado derecho de esta casilla aparece el cuadro de sugerencia [Fig.3-95]. En
este cuadro encontramos el nombre de la variable, el nivel de medida actual y
el nivel sugerido por el programa; generalmente cuando las variables son
categricas el programa no puede diferenciar entre Ordinal y Nominal por lo
que habilita una opcin de seleccin para cada una de las posibilidades, as
como una breve explicacin del porqu la variable debe ser categrica.

Adems de estas opciones, el programa anexa en la parte inferior del cuadro,


la definicin de cada uno de los niveles de medida para que nos orientemos.
Desde luego la decisin del nivel de medida debe ser tomada por el usuario de
acuerdo a su criterio, ya que el programa se limita a indicar cual debe ser el
nivel de medida ms adecuado.

Para seguir con la definicin, seleccionamos la opcin Ordinal y posteriormente


hacemos clic en Continuar con lo que volvemos al cuadro principal [Fig.3-96].
Note como en el listado aparece al costado derecho de la variable un nuevo
icono ( ); el cual nos indica que la variable es de tipo categrico.
Figura 3-96

Una vez completada la definicin de la variable Clase social, proseguimos con


la variable Edad. Al seleccionarla en el listado de variables, aparecen en la
casilla de valores los diferentes rangos con que cuenta. Desde luego, la
variable Edad es de tipo Escala por lo que su definicin es ms sencilla, debido
a que para este tipo de variables no se definen etiquetas de valor, ya que sus
valores representan magnitudes o cantidades y no categoras de pertenencia.
Para esta variable slo definimos las propiedades Etiqueta y Ancho. Si nos
fijamos en los valores de la variable, notaremos que van desde el nmero 18
hasta el nmero 44, lo que nos indica que el ancho debe ser de dos cifras.
Para continuar ingresamos la etiquetaEdad del encuestado y definimos el
nmero 2 en la casilla Ancho [Fig.3-97].

Continuando con el ejemplo, seleccionamos en el listado la variable Gnero.


Note que las casillas Tipo, Ancho y Decimales no estn activas para esta
variable, esto se debe a que la variable contiene en sus datos caracteres
alfabticos, adems note como el nivel de medida se encuentra definido en
Nominal, esto se debe a que por defecto el programa asigna el nivel Nominal a
las variables que contienen caracteres Alfanumricos (Cadena). Para esta
variable slo definimos las propiedades Etiqueta y Etiquetas de valor.

Figuras 3-97 y 3-98

Para realizarlo, nos dirigimos a la casilla etiqueta e ingresamos la


leyenda Gnero del encuestado; sucesivamente nos dirigimos a la
columna Etiqueta (Casilla de valores) y le ingresamos al valor (F) la
leyenda Femenino y al valor (M) la leyendaMasculino [Fig.3-98].
Despus de definir la totalidad de las variables hacemos clic en Aceptar con lo
que volvemos al editor de datos de SPSS y a su vez las propiedades de las
variables son modificadas [Fig.3-99]. Si seleccionamos la vista de variables,
apreciaremos que las modificaciones realizadas con el procedimiento aparecen
en las columnas de propiedades [Fig.3-100].

Figuras 3-99 y 3-100

En conclusin el procedimiento Definir propiedades de variables, nos permite


declarar los parmetros de las variables de un archivo de forma rpida y
sencilla, a travs de un solo cuadro de dilogo; a su vez, este procedimiento
nos proporciona la posibilidad de aplicar las etiquetas de valor de una variable
a las restantes del archivo. Es importante resaltar que este procedimiento
realiza una exploracin de los datos y nos proporciona informacin detallada
como un listado de los valores encontrados y el nmero de valores sin etiqueta.
Adems nos ofrece una funcin de etiquetas automticas, la cual le otorga un
valor numrico ascendente a cada uno de los valores encontrados dentro de la
variable.

Copiar Propiedades de Datos en SPSS


El procedimiento Copiar propiedades de datos nos ofrece la posibilidad de
extraer las caractersticas de un archivo de datos de SPSS previamente
diligenciado y emplearlas como plantilla para definir las propiedades de las
variables de otro archivo. A su vez, este procedimiento tambin nos permite
aplicar las etiquetas de valor de una variable a las dems variables del
mismo archivo. Para poder ejecutarel procedimiento, es necesario contar
con un archivo abierto en el editor de datos, el cual ser considerado por el
programa como el archivo de trabajo.

Generalmente el archivo de trabajo, es al que se le adhieren


las propiedades de losdatos. Por el contrario, el archivo que proporciona los
parmetros de laspropiedades de las variables, es considerado por el programa
como el Archivoexterno y no requiere ser abierto en el editor. Para comprender
mejor la metodologa empleada en la copia de propiedades, vamos a realizar
un ejemplo con los archivos Infodatos.sav y datoscompleto.sav, los cuales se
encuentran en lacarpeta Captulo3 del CD adjunto.

Como archivo de trabajo emplearemos el archivo Infodatos, por lo que


debemos abrirlo en el editor de datos; para ello vamos al men Archivo,
seleccionamos la opcin Abrir y en ella escogemos la opcin Datos. Al surgir la
ventana de navegacin, ubicamos el archivo en la carpeta Captulo3 y lo
abrimos, de manera que su informacin aparezca en el editor.

Para usar el procedimiento, debemos ir al men Datos y seleccionar la


opcinCopiar Propiedades de datos [Fig.3-101]; al activar esta opcin, aparece
el cuadro de dilogo correspondiente a Copiar propiedades de datos Paso 1 de
5 [Fig.3-102]. En este cuadro encontramos una breve bienvenida, as como una
explicacin de los procesos que se pueden realizar. En la parte inferior del
cuadro, aparece la opcin Seleccione el origen de los datos; para lo que nos
brinda dos posibilidadesUn archivo de datos de SPSS
externo El archivo de datos de trabajo.

Figuras 3-101 y 3-102

Antes de determinar el archivo de datos de origen es necesario conocer los


requerimientos del programa. Al copiar las propiedades de datos, se aplicarn
las siguientes reglas:

Para definir un archivo externo como archivo de datos de origen, deber


tratarse de un archivo dedatos con formato SPSS.
Para utilizar el archivo de trabajo como archivo de datos de origen, deber
contener al menos unavariable. No se puede utilizar un archivo que est
completamente en blanco como archivo dedatos de origen.
Las propiedades no definidas (vacas) del archivo de datos de origen no
reemplazaran laspropiedades definidas en el archivo de datos de trabajo.
Las propiedades de variable slo se copiarn si las dos variables (Origen y
Destino) son del mismo tipo (Alfanumricas [Cadena] o Numricas).

Una vez aclaradas las reglas que se deben seguir en la copia de propiedades,
continuamos con el ejemplo. Vamos a definir un archivo externo como origen
de la informacin de las propiedades, por lo que hacemos clic en el botn
Examinar. Al aparecer la ventana de navegacin, ubicamos
el archivo Datoscompleto.sav en lacarpeta Captulo3 del CD adjunto y
posteriormente hacemos clic en Abrir, con lo que la ventana de navegacin se
cierra y aparece en la casilla la ruta de ubicacin del archivo.
Para continuar hacemos clic en Siguiente, con lo que se obtiene el cuadro de
dilogo correspondiente al Paso 2 de 6 [Fig.3-103]. En este paso se define el
proceso que deseamos realizar y las variables que se involucrarn. Si nos
fijamos en la parte superior del cuadro, notaremos que aparecen tres diferentes
opciones de procedimiento.

Figura 3-103

La primera opcin es Aplicar propiedades de variables del archivo de origen a


variables coincidentes del archivo de trabajo; esta opcin nos permite agregar
laspropiedades de un archivo a las variables que tengan el mismo nombre y el
mismo tipo (Cadena o Numrica) de un segundo archivo. Adicionalmente, esta
opcin cuenta con una propiedad denominada Crear variables coincidentes en
el archivode datos de trabajo si an no existen, esta opcin actualiza el listado
para que se muestren todas las variables del archivo de datos externo.

Si se selecciona una variable del archivo externo que no existe en al archivo de


Trabajo, el programa crear la variable seleccionada con el mismo nombre y
las mismas propiedades. Es importante aclarar que este procedimiento no
importa la informacin, sino que define las propiedades para una
nueva variable.

La segunda opcin es Aplicar propiedades de una nica variable de origen a


variables seleccionadas del mismo tipo del archivo de trabajo; al seleccionar
esta opcin, se aplicarn las propiedades de una nica variable del archivo de
origen a las variables que se seleccionen del archivo de trabajo.

La ltima opcin del cuadro corresponde a Aplicar slo propiedades de


conjunto de datos (sin seleccin de variables); al activar esta opcin el
programa copia en el archivo de trabajo nicamente los conjuntos de respuesta
mltiple, los conjuntos de variables y los documentos que se hayan definido
para el archivo de origen.

Para continuar con el ejemplo seleccionaremos la primera opcin, con lo que


aparece en la parte inferior del cuadro dos casillas con las variables
coincidentes en los dos archivos. Si nos fijamos en la parte inferior de la casilla
correspondiente al archivo de trabajo (Infodatos), notaremos que aparece
las leyendas (Variables coincidentes: 10; Variables que se van a crear: 0).
Estas leyendas nos indican que ninguna de las variables no coincidentes
del archivo de origen (Datoscompletos) ser copiada en el archivo de destino.
Al hacer clic en el botn Siguiente, aparece el cuadro de dilogo
correspondiente al Paso 3 de 5.

En la Siguiente leccin continuaremos con


el Procedimiento Copiar Propiedadesde Datos de SPSS en Espaol.

Copiar Propiedades de Datos 2da Parte


Al hacer clic en el botn Siguiente, aparece el cuadro de dilogo
correspondiente al Paso 3 de 5 [Fig.3-104]. En este paso debemos definir
las propiedades que deseamos copiar del archivo de origen. Dentro
el listado de opciones que podemos elegir encontramos las Etiquetas de
valor, Valores perdidos, Etiqueta de variable, Nivel de medida, Formatos,
Alineacin y Ancho de columna en el editor de datos.

Adems de estos parmetros, el programa nos ofrece dos opciones adicionales


correspondientes a Reemplazar y Fundir. Al seleccionar la opcin reemplazar,
el programa cambia todos los datos que se hayan definido en el archivo de
destino (Infodatos) y coloca en su lugar los parmetros del archivo externo. Si
por el contrario seleccionamos la opcin Fundir, el programa une
las propiedades de los dos archivos, complementndose entre si. En el caso
que coincida una propiedad en los dos archivos, el programa le da prelacin al
archivo de destino y no lo modifica.

Figuras 3-104 y 3-105

Dado que por defecto el programa selecciona todas las propiedades y la opcin
reemplazar, no modificaremos nada y continuamos haciendo clic en Siguiente,
con lo que aparece el cuadro de dilogo correspondiente al Paso 4 de 5 [Fig.3-
105]. En este paso se definen las propiedades del conjunto de datos que se
copiaran del archivo externo.

Si nos fijamos en el cuadro, notaremos que ninguna de las opciones se


encuentra activa, esto se debe a que en el archivo de origen no se han definido
conjuntos de respuesta mltiple, conjuntos de variables o redactado
documentos. La nica opcin que encontramos activa corresponde a Etiquetas
de archivo, la cual corresponde a la etiqueta descriptiva del contenido del
archivo; esta etiqueta slo es til en el caso que se exporten los datos
contenidos en l a otro formato.

Para continuar seleccionaremos la opcin y sucesivamente


hacemos clic enSiguiente con lo que aparece el cuadro de dilogo
correspondiente a Paso 5 de 5[Fig.3-106]. En este paso encontraremos un
breve resumen de las variables a las que se le aplicaran propiedades, las
variables que sern creadas y laspropiedades del conjunto de datos que se
copiarn.

En la parte inferior del cuadro aparecen las opciones de procedimiento


(Ejecutar sentencia y Pegar sentencia en una ventana de sintaxis); debemos
recordar que siempre que se pegue la sintaxis el procedimiento no se realiza
hasta que se ejecute dicha sintaxis. Por el momento seleccionaremos la
primera opcin.

Para terminar la copia de las propiedades de los datos


hacemos clic en Finalizar, con lo que las variables de archivo de trabajo
adquieren las propiedades del archivo de origen. Los resultados de este
procedimiento se hacen notorios en el editor de datos de SPSS [Fig.3-107]; al
seleccionar el botn etiquetas ( ) en la barra de herramientas, aparecern
las categoras a las que corresponde cada uno de los valores de las variables.

Figura 3-103

El procedimiento Copiar propiedades de datos, es el homologo del


procedimientoDiccionario de datos empleado en las versiones anteriores de
SPSS. Para los usuarios que tuvieron la oportunidad de conocer dicho
procedimiento considerarn que se ha aumentado drsticamente el nmero de
pasos empleados para copiar las propiedades de un archivo. Esta apreciacin
no es del todo correcta ya que la copia de propiedades puede ser realizada con
un solo paso.

Para comprobarlo vamos a realizar la copia de propiedades entre los archivos


origen.sav y destino.sav, los cuales contienen la misma informacin de los
archivos Datoscompleto y Infodatos respectivamente. Antes de iniciar el
procedimiento, es necesario abrir el archivo destino.sav en el editor de datos.
Una vez aparecen los datos del archivo en el editor, debemos comprobar que
ninguna de las variables se encuentre definida, para lo que activamos la vista
de variables.

Despus de comprobar que el archivo no tiene establecido ningn parmetro,


debemos activar el procedimiento mediante la ruta (Datos...
Copiar propiedadesde datos); al aparecer el cuadro de dilogo, seleccionamos
el botn Examinar, con lo que surge la ventana de navegacin. A travs de
esta ventana ubicamos el archivo Origen.sav en la carpeta Captulo3 del CD
adjunto y sucesivamente hacemos clic en Abrir con lo que se cierra la ventana
de navegacin y aparece en la casilla la ruta donde se localiza el archivo
externo (E:/Captulo3/Origen.sav) [Fig.3-108]. Para completar la copia de
las propiedades hacemos clic en Finalizarvolviendo al editor de datos y a su
vez las variables del archivo destino adquieren las propiedades definidas para
las variables del archivo Origen.sav [Fig.3-109].

Figuras 3-108 y 3-109

En conclusin el procedimiento Copiar propiedades de datos nos permite


trasladar las caractersticas de los datos de un archivo de SPSS previamente
diligenciado a un nuevo archivo de datos, pero adems nos ofrece la
posibilidad de determinar los parmetros que nos interesa copiar, por medio de
una serie de cuadros de dilogo en los que se especfica cada una de
las propiedades.

Fundir Archivos de SPSS - Aadir Casos


Es posible que en algunas ocasiones se cuente con informacin
complementaria distribuida en varios archivos de datos, lo que impide realizar
un anlisis con la totalidad de la informacin, debido a que SPSS nicamente
nos permite tener un solo archivo de datos abierto a la vez. Para poder generar
anlisis con el total de la informacin, es necesario aglomerar los datos
(Variables y casos) de las diferentes fuentes dentro de un nico archivo.

Para esta labor SPSS cuenta con un procedimiento que nos permite congregar
informacin proveniente de diferentes archivos, con la condicin que el
proceso se realice en pares de ficheros; es decir, slo podemos reunir
informacin de dos archivos por cada proceso de fusin que se ejecute.
Para la unin de informacin, el procedimiento nos ofrece dos posibilidades, la
primera consiste en agregar los casos o respuestas de una fuente externa
dentro del archivo principal y la segunda consiste en importar las variables y
sus respectivas respuestas desde una fuente externa. Cada una de estos
procedimientos cuenta con unos criterios que se deben cumplir para su
correcto funcionamiento, los cuales conoceremos en los apartados siguientes.

Agregar o aadir Casos


Este procedimiento se utiliza cuando se cuenta con dos o ms archivos con el
mismo tipo de variables o preguntas y cuya nica diferencia radica en las
respuestas o casos. Un ejemplo de este tipo de archivos pueden ser las ventas
regionales de un producto, las encuestas realizadas a personas de diferentes
departamentos de un pas, etc. Para poder comprender los pasos que se
debenejecutar en la fusin de informacin, realizaremos a manera
de ejemplo la unin de los casos de los
archivos hogareste.sav y hogarsur.sav incluidos en la carpetaCaptulo3 del CD
adjunto, los cuales contienen informacin de una encuesta realizada en cien
(100) hogares de cada regin.

Para poder realizar la fusin de archivos con variables iguales y casos


diferentes, es necesario abrir primero uno de los archivos en el Editor de datos
de SPSS, ya sea por medio del men Archivo..Abrir...Datos mediante el
icono Abrir ( ). En nuestro caso utilizaremos el archivo hogareste.sav como
archivo de destino, por lo que es necesario abrirlo en el editor de datos. Una
vez abierto el archivo, elegimos en el men Datos la opcin Fundir archivos y
dentro de ella seleccionamos elprocedimiento Aadir casos [Fig.3-110]. Al
hacer clic en l, aparece una ventana de navegacin en donde ubicamos el
archivo externo, del cual vamos a extraer la informacin, que para el caso
corresponde a hogarsur.sav y se encuentra ubicado en la carpeta Captulo3 del
CD adjunto [Fig.3-111].

Figuras 3-110 y 3-111

Despus de localizar el archivo, lo seleccionamos y hacemos clic en Abrir, con


lo que aparece el cuadro de dilogo correspondiente Aadir casos
desde [Fig.3-112]; note como en la parte superior del cuadro se hace referencia
a la ubicacin y nombre del archivo externo, de donde sern extrados los
casos.
Figura 3-112

Este cuadro se encuentra dividido en tres secciones; la primera corresponde a


lalista de variables desemparejadas, en donde aparecen las variables que por
algn motivo no se encuentran en los dos archivos. Generalmente son dos los
factores que causan su aparicin, ya sea por que tienen nombres diferentes en
cada uno de los archivos (EJ: NMHAB y HABITANT estas dos variables
hacen referencia al nmero de habitantes de un hogar y su diferencia radica en
el nombre que se le asigno en cada archivo); la segunda razn es por la
existencia de variables nicas en cada archivo, es decir variables que fueron
creadas en uno de los archivos pero omitidas en el otro.

Adicionalmente, se suelen incluir en este listado las variables que no tengan el


mismo tipo de caracteres definido as su nombre coincida en ambos archivos
(Ej: una variable de cadena con una numrica), as como tambin las variables
de cadena que contengan diferente longitud de caracteres.

La segunda seccin del cuadro corresponde a Variables en el nuevo archivo de


datos de trabajo; en esta casilla encontraremos las variables que han
coincidido en los dos archivos, la nica condicin que han cumplido estas
variables es tener el mismo nombre y el mismo tipo de datos (Numrico o
Cadena) en los dos archivos. Si nos fijamos en el listado observaremos que
cada una de las variables cuenta con un nombre nico y no se encuentran
duplicados; esto se debe a que el programa rene los casos de los dos
archivos en una sola variable y le asigna el nombre que aparece en los dos
archivos.

La tercera seccin del cuadro corresponde a especificacin de archivos, en


donde encontramos dos leyendas que nos informan la procedencia de las
variables. Para la identificacin, el programa utiliza dos marcadores, el primero
corresponde al Asterisco (*), quien identifica a las variables procedentes del
archivo de datos de trabajo (archivo que se encuentra abierto en el editor de
datos), al cual le estamos importando la informacin. El segundo marcador es
el signo Suma (+), quien identifica las variables del archivo externo o archivo al
que se le extraer la informacin.

Adems de las secciones, encontramos en el cuadro cuatro opciones


adicionales correspondientes a Cambiar Nombre; esta opcin nos permite
modificar el nombre de una variable, generalmente se manipula el nombre de
una variable para generar una pareja, es decir se le asigna el nombre de una
de las variables del otro archivo, con el fin de facilitar el reconocimiento de la
variable en el archivo resultante.

Casar, esta opcin nos permite unir el contenido de dos variables con
diferentes nombres siempre que sean de archivos diferentes; generalmente la
utilizamos para definir una pareja de datos.
Indicar el origen del caso como variable; esta opcin genera una nueva variable
en el archivo de resultado, en donde ubicar un valor 0 a los casos del archivo
de trabajo y un valor 1 a los casos del archivo externo o secundario; adems
cuenta con una casilla para la asignacin del nombre de la variable de
identificacin.

Por ltimo encontramos el icono Flecha ( ), con el cual podemos agregar al


archivo de resultado las variables desemparejadas que deseemos, esta opcin
la utilizamos en las variables que no se encuentran en los dos archivos, es
decir variables no relacionadas.

Para continuar con el ejemplo, vamos a definir como una pareja las variables
NUMHAB y HABITANT, para realizarlo debemos seleccionar las dos variables
por lo que hacemos clic en una de las variables y luego hacemos (Ctrl + clic) en
la otra. Este mtodo es de bastante utilidad ya que generalmente aparece un
gran listadode variables desemparejadas y la seleccin de variables se hace
tediosa.

Despus de seleccionar las variables (Resaltarlas), hacemos clic en Casar con


lo que las variables pasaran a la casilla de variables en el nuevo archivo de
datos de trabajo; para terminar activamos la opcin Indicar origen del caso
como variable y le especificamos el nombre origen [Fig.3-113] y posteriormente
hacemos clic enAceptar con lo que aparecer el archivo resultante en el editor
de datos [Fig.3-114].

Figuras 3-113 y 3-114

Si nos fijamos en el editor de datos, observaremos que el nmero de


casos ha pasado a la cifra de doscientos casos (200), as mismo
notaremos que en la parte final de las columnas de variables, aparece la
variable Origen. Adems, si nos fijamos en el nombre del archivo de resultado,
notaremos que esta representado con el nombre de Hogareste, debemos tener
mucho cuidado en el momento de guardar el archivo, ya que si no se le asigna
un nuevo nombre perderemos la informacin original del archivo Hogareste;
para evitar este inconveniente lo guardaremos bajo el nombre de Hogares en la
carpeta Mis documentos de la unidad [C:].

Es importante resaltar que este procedimiento lo utilizamos para reunir la


mayor cantidad posible de informacin, pero es recomendable mantener los
archivos originales intactos, ya que generalmente se le hacen anlisis a cada
uno de ellos para comparar los resultados.

Aadir Variables - Fundir Archivos SPSS


El segundo procedimiento con que cuenta SPSS para la fusin de informacin
corresponde a Aadir variables. A travs de esta aplicacin podemos reunir las
variables de dos o ms archivos en un solo fichero, con la condicin que la
informacin de las variables sea complementaria y pertenezca a los mismos
individuos o casos.

Generalmente estos archivos se presentan al realizar nuevas pruebas o


exmenes al mismo grupo de individuos con un intervalo de tiempo entre
pruebas. Su utilidad radica en la capacidad de medir los resultados de un
proceso o mtodo y se pueden hallar en la medicina, la industria, la publicidad,
etc.

Para comprender los pasos que se deben ejecutar para la fusin de variables
de mltiples archivos, vamos a generar un ejemplo con los
archivos Hogar.sav yElectro.sav, incluidos en la carpeta Captulo3 del CD
adjunto. Estos archivos contienen la misma informacin del
archivo hogareste.sav utilizado en el ejemploanterior y la nica diferencia que
se puede destacar consiste en la presencia de la variable ID (Nmero de
identificacin), la cual es anexada en los dos archivos.

Para poder realizar la fusin de informacin cuando se tienen archivos con los
mismos Casos pero variables diferentes, es indispensable que los archivos
tengan en comn por lo menos una variable; es decir, debe existir una variable
con el mismo nombre y con los mismos valores en cada uno de los archivos, a
la cual el programa denomina Variable de Control. Adems de la variable de
control, SPSS tiene dos requerimientos que se deben cumplir antes de realizar
la fusin de los archivos:

Los casos deben estar ordenados en forma ascendente de acuerdo con


los valores de la variable de control en los dos archivos
Las variables de los dos archivos deben estar en el mismo orden de
acuerdo a las variables de control. Esta opcin se utiliza cuando tenemos
ms de una variable de control y lo que nos indica es que las variables de
control deben estar ubicadas en el mismo orden dentro de los dos
archivos.
Para comprobar si los archivos cumplen con estos requisitos, debemos abrirlos
en el editor de datos de SPSS. Dado que el programa slo permite contar con
un archivo de datos abierto a la vez, abriremos primero el archivo Hogar y
posteriormente el archivo Electro. Para realizarlo, nos dirigimos al
menArchivo..Abrir..Datos; al aparecer la ventana de navegacin, ubicamos en
lacarpeta Captulo3 del CD adjunto el archivo Hogar.sav; una vez lo
localizamos hacemos clic en Abrir, con lo que su contenido se representa en el
editor de datos de SPSS [Fig.3-115].

Figuras 3-115 y 3-116

Si nos fijamos en la variable ID (Nmero de identificacin) notaremos que los


casos se encuentran en desorden, lo que infringe el primer requisito del
programa. Para ordenar los casos, debemos seleccionar la variable haciendo
clic sobre ella. Al activarse la variable ubicamos el puntero del ratn en la parte
superior de la columna y hacemos clic derecho, con lo cual aparece el men
desplegable [Fig.3-116].

En la parte inferior del men encontramos dos opciones de ordenamiento


(Ascendente y Descendente); para continuar seleccionamos la opcin
correspondiente a Ordenar de forma ascendente, con lo que desaparece el
men y los datos se ordenan.

Una vez se ejecuta la opcin Ordenar, es necesario guardar los cambios o de


lo contrario perderamos el orden establecido; en este caso guardaremos los
cambios del archivo bajo el nombre Hogar en la carpeta Mis documentos de la
unidad [C:]. Despus de ordenar los casos, debemos comprobar el orden de
las variables; dado que este es el primer archivo de inters, nos limitaremos a
explorar las variables que contiene, que para el caso son (Id, Regin, Habitant,
Hijos, Jefehoga y Estrato).

Una vez comprobado el primer archivo, procedemos a revisar el segundo, por


lo que debemos abrirlo en el editor de datos [Fig.3-117]. Si nos fijamos en el
contenido del archivo, notaremos que la variable ID (Nmero de identificacin)
ya se encuentra ordenada en forma ascendente. Al revisar las variables,
notaremos que la variable Regin se encuentra presente en los dos archivos,
pero esta ubicada en una posicin diferente dentro del archivo Electro.sav, por
lo que es necesario reacomodarla.
Figuras 3-117 y 3-118

Para realizarlo, debemos primero seleccionarla haciendo clic sobre el nombre


de la variable, de manera que se resalte toda la columna; despus de activarla,
hacemos clic sobre ella y manteniendo el botn del ratn oprimido la
arrastramos hasta ubicarla al costado derecho de la variable ID de manera que
aparezca una lnea roja entre las dos columnas; al soltar el botn del ratn la
variable aparece [Fig.3-118].

Una vez modificada la posicin de la variable Regin obtenemos el orden de


variables (Id, Regin, televiso, nevera, estufa, telfono y PC). Es necesario
guardar los cambios realizados en el archivo, en la carpeta Mis documentos de
la unidad [C:] antes de realizar la fusin.

Despus de comprobar que los archivos cumplen con los requerimientos del
programa, estamos listos para comenzar con la fusin de los archivos. En la
siguiente leccin continuaremos con la adicin de variables -
Procedimiento Aadir Variables de SPSS en Espaol.

Aadir Variables en SPSS - 2da Parte


Despus de comprobar que los archivos cumplen con los requerimientos del
programa, estamos listos para comenzar con la fusin de los archivos. Lo
primero que debemos hacer es abrir uno de los archivos en el editor de datos
(en este caso, ya se encuentra abierto el archivo Electro.sav).

Una vez abierto, nos dirigimos al men Datos, ubicamos la


opcin Fundir archivosy seleccionamos el procedimiento Aadir
variables. [Fig.3-119]. Al surgir la ventana de navegacin, ubicamos el archivo
secundario o externo (en este caso Hogar.sav) y hacemos clic en abrir con lo
que aparece el cuadro de dilogo correspondienteAadir variables de [Fig.3-
120], el cual nos indica el nombre del archivo del que se estn importando las
variables.
Figuras 3-119 y 3-120

Este cuadro de dilogo se encuentra dividido en cuatro secciones; la primera


de ellas corresponde a Variables excluidas, en donde encontraremos
un listado de las variables que han sido separadas del archivo de datos
fusionado. Por defecto, lalista contiene los nombres de las variables del archivo
externo que duplican los del archivo de trabajo. Si se desea incluir en el archivo
fusionado una variable excluida con un nombre duplicado, es necesario
cambiar el nombre de la variable y aadirla a la lista de variables del nuevo
archivo de trabajo, haciendo clic en el botn Flecha ( ) que aparece al costado
derecho de la casilla.

La segunda seccin la componen el Nuevo archivo de datos de trabajo, en


donde se muestra un listado de las variables que se van a incluir en el nuevo
archivo de datos fusionado. Por defecto, el programa incluye en la lista todos
los nombres de variable nicos que existan en ambos archivos (Trabajo y
Externo), as como una de las variables que tengan el mismo nombre en los
dos archivos.

Adicionalmente incluye las variables de control, las cuales utiliza


para emparejar los casos de los dos archivos. En el suceso que uno de los
archivos cuente con ms casos que el otro, el nuevo archivo de datos los
incluye, pero slo contendr informacin para los casos del archivo que los
proporcione, mientras que para los casos del otro archivo ingresa valores
perdidos por el sistema; es decir, casillas vacas.

La tercera seccin la componen las Opciones de fusin, en donde encontramos


el botn Cambiar nombre, el cual utilizamos para modificar el nombre de
las variables que seran excluidas. En esta seccin tambin aparece la
opcin Emparejar los casos en las variables clave para los archivos
ordenados, en donde hallamos tres posibilidades; Ambos archivos facilitan
casos, archivo externo es una tabla de claves y el archivo de trabajo es una
tabla de claves.

La opcin ambos archivos facilitan casos nos permite indicarle al programa que
los dos archivos cuentan con casos nicos y por lo tanto no aparecen en el
otro; al seleccionar esta opcin es indispensable definirle al programa una
variable clave que le permita al archivo determinar el orden de emparejamiento
de los casos o de lo contrario no es posible realizar el procedimiento.
Es necesario resaltar que una tabla de claves o tabla de referencia, es un
archivo en el que los datos de cada "caso" se pueden aplicar a varios casos del
otro archivo de datos. Por ejemplo, si un archivo contiene informacin sobre los
diferentes miembros de la familia (como el sexo, la edad, la formacin) y el otro
contiene informacin global (como los ingresos totales, el nmero de
miembros o la ubicacin), se puede utilizar el archivo global como una tabla de
referencia y aplicar los datos comunes de la familia a cada uno de sus
miembros en el archivo fusionado.

Una de las caractersticas principales de los archivos de claves es


el reducidonmero de casos que contienen, ya que su utilidad radica en poder
disminuir la cantidad de registros dentro del archivo. La tercera parte de esta
seccin corresponde a Indicar el origen del caso como variable, esta
opcin genera una nueva variable en el archivo de resultado en donde
ubicar un valor 0 a los casos del archivo de trabajo y un valor 1 a los
casos del archivo externo o secundario; adems cuenta con una casilla para
la asignacin del nombre de la variable de identificacin.

Por ltimo encontramos la seccin de especificacin de archivos, en donde


aparecen dos leyendas que nos informan la procedencia de las variables; es
decir, nos indica el archivo en el que se localiza la variable. Para esta funcin el
programa emplea dos marcadores; el primero corresponde al Asterisco (*),
quien identifica a las variables procedentes del archivo de datos de trabajo o
archivo al cual le estamos importando la informacin; el segundo marcador es
el signo Suma (+), quien identifica las variables del archivo secundario o
externo, a quien se le extraer la informacin.

Para continuar con el ejemplo activaremos la opcin Indicar el origen del caso
como variable, dejando estipulado el nombre Origen; sucesivamente
seleccionaremos la opcin Ambos archivos facilitan casos, por lo que
seleccionamos en la casilla de variables excluidas la variable ID y la
ingresamos en la casilla Variables clave; para realizarlo es necesario resaltar la
variable y posteriormente hacer clic en el botn flecha ( ) ubicado en la parte
inferior del cuadro, al costado izquierdo de la casilla variables clave, de manera
que obtenemos los resultados de la figura [3-121].

Figuras 3-121 y 3-122

Despus de seleccionar la opcin hacemos clic en Aceptar con lo que aparece


la leyenda (Advertencia: La correspondencia indicada fallar si los datos no se
ordenan por orden ascendente respecto a las variables clave); nuevamente
hacemos clic en Aceptar con lo que el procedimiento se realiza y las variables
se representan en el editor de datos de SPSS [Fig.3-122].

Si nos fijamos en la variable Origen, notaremos que todos los valores se


encuentran en 1, esto se debe a que todos los casos se importaron las
variables del archivo externo; al igual que en el ejemplo anterior es necesario
guardar el archivo de resultado con otro nombre o si no perderemos la
informacin original. Es necesario resaltar que las variables del archivo de
datos de resultado contendr las propiedades definidas en los archivos de
origen.

En conclusin la opcin Aadir variables nos permite unir la informacin de dos


archivos cuyas variables estn relacionadas, siempre que sus casos
correspondan a los mismos sujetos u observaciones. Adems
este procedimiento nos permite aplicar en el archivo de resultado las
propiedades definidas para cada una de las variables en su archivo de origen.

Depurar Datos en SPSS


Por ms cuidadosos que seamos, es muy factible que se cometan errores en el
proceso de introduccin de los datos, por lo que antes de comenzar a generar
anlisis es necesario realizar una depuracin de la informacin como una
medida de control para evitar distorsiones en los resultados de los
procedimientos. La mayora de los errores en la informacin son causados en
la captura o digitacin de los datos; para poder identificar estos errores es
indispensable generar tablas de frecuencia por cada una de las variables del
archivo, con el fin de determinar los valores que se encuentran fuera del rango
de las posibles respuestas establecidas.

Desde luego el proceso de depuracin se debe realizar despus de definir las


propiedades de las variables o de lo contrario se dificultara bastante la
identificacin de los valores errneos.

Para comprender los pasos que conlleva la depuracin de los datos, vamos a
realizar un ejemplo con el archivo Depu.sav, que se incluye en la
carpeta Captulo3del CD adjunto. Antes de iniciar el proceso de depuracin de
los datos, es necesario abrir el archivo en el editor de datos de SPSS, ya sea
mediante la rutaArchivo...Abrir...Datos o mediante el botn Abrir ( ) ubicado
en la barra de herramientas.

Una vez abierto notaremos que el archivo esta compuesto por las
variables ID(Nmero de encuesta), Gnero (Sexo del
encuestado), Estciv (Estado civil) y Edad(Edad del encuestado) [Fig.3-123]. Es
de gran importancia tener una idea de los datos que contienen el archivo para
poder optimizar el proceso de depuracin.

En nuestro archivo de ejemplo, slo contamos con dos variables Categricas


(Gnero y Estciv). Para el gnero se han definido como valores validos (1=
Femenino y 2= Masculino) y para la variable estado civil las categoras (1=
Soltero, 2= Casado, 3= Divorciado, 4= Viudo, 5= Unin libre y 9= No responde).
Las variables ID y Edad son de tipo Escala y por lo tanto no tienen etiquetas de
valor.

Figuras 3-123 y 3-124

Una vez abierto el archivo de datos y despus de explorar su contenido,


estamos listos para empezar con la depuracin de los datos. El primer paso en
la depuracin corresponde a identificar los valores errneos; para realizarlo
debemos generar una tabla de frecuencia para cada una de las variables, por
lo cual vamos al men Analizar y seleccionamos el submen Estadsticos
descriptivosy dentro de l escogemos la opcin Frecuencias [Fig.3-124].

Al hacer clic sobre esta opcin aparece el cuadro de dilogo correspondiente


aFrecuencias [Fig.3-125]. Este cuadro se encuentra dividido en dos secciones;
la primera de ellas corresponde a la lista de variables, donde aparecen todas
las variables con que cuenta el archivo; la segunda seccin corresponde al
listado devariables seleccionadas, donde aparecen las variables a las que se le
realizar el clculo de frecuencias. Para ingresar una variable al listado de
seleccin, debemos hacer clic sobre ella de manera que se resalte y
sucesivamente hacer clic en el icono Flecha ( ) ubicado entre las dos casillas,
de manera que la variable elegida pasar a la casilla de seleccin.

Figura 3-125

Para continuar con el ejemplo ingresaremos las variables Edad, Estciv y


Gnero a la casilla de seleccin y posteriormente hacemos clic en Aceptar, con
lo que lastablas de frecuencia sern representadas en la ventana visor
de resultados. El programa por defecto nos ensea primero la tabla
de resumen en la que incluye los casos validos y perdidos para cada una de las
variables. A continuacin nos ensea las tablas de frecuencia de cada una de
las variables seleccionadas.

Si nos fijamos en la tabla de frecuencia de la variable Edad, notaremos que


existen una gran cantidad de valores, lo que nos impide observar los valores
errados. Para poder identificar un valor errado es necesario observar en la
primera y en la ltima parte de la tabla y tratar de buscar un valor inferior a 15 o
superior a 70. Sino existen estos valores extremos, no es posible determinar si
se cometieron errores en la captura o digitacin de los datos.

Este suceso es exclusivo para las variables de escala. Si continuamos bajando,


encontraremos las tablas de frecuencia para las variables Estado civil [Fig.3-
126] y Gnero [Fig.3-127]. Si nos fijamos en la tabla de la variable Estado civil,
apreciaremos que se encuentran dentro de los datos tres valores errneos
correspondientes a los nmeros 0, 7 y 10, los cuales representan 6 casos o el
1.6 % de la muestra. Para facilitar su identificacin hemos resaltado estos
valores con el color rojo. Si por el contrario nos fijamos en la variable Gnero,
notaremos que aparece el valor tres (3) y representa 14 casos o el 4.7 % de la
muestra.

Figura 3-126

Figura 3-127

Una vez se han detectado los valores errneos, debemos ubicar los casos a los
que pertenece cada uno de ellos. Los metodos empleados para ubicar los
casos de origen los veremos en la siguiente leccin.

Buscar Datos en SPSS - Depurar 2da Parte


Para la ubicacin de casos SPSS nos ofrece dos posibilidades; la primera
consiste en localizar de forma manual cada uno de los valores errados dentro
de la variable, por medio de la opcin Buscar. Y la segunda posibilidad consiste
en crear filtros que nicamente habiliten para los procedimientos
los valores errados. Para comprender la diferencia de estos mtodos,
realizaremos la ubicacin de losvalores errados en la variable Gnero a travs
del primer mtodo y la ubicacin de los valores errados de la variable Estado
civil por medio de los filtros.

Para activar la opcin Buscar, debemos ir al men Edicin y seleccionar


elprocedimiento con el mismo nombre; al hacer clic sobre l aparece el cuadro
de dilogo correspondiente [Fig.3-128].

Figura 3-128

Para activar esta ventana, debemos hacer clic sobre el nombre de la variable
en la que deseamos realizar la bsqueda, de manera que el nombre de la
variable aparezca en la parte superior del cuadro. Una vez se activa,
ingresamos el valor que deseamos localizar en la casilla Buscar qu y
sucesivamente hacemos clic en el botn Buscar siguiente, de manera que el
cursor se ubica en el primer caso en el que encuentre el valor definido; si
volvemos a presionar el botn, el programa pasar al siguiente caso que
concuerden con el valor definido.

Dado que en la tabla de frecuencias de la variable Gnero, logramos detectar


que el valor errneo corresponde al nmero tres (3), ingresaremos este valor
en la casilla Buscar en y sucesivamente hacemos clic en el
botn Buscar siguiente con lo que el cursor se ubica en la fila nmero 13. Si
seguimos haciendo clic en el botn obtendremos los casos 19, 25, 33, 43, 52,
64, 81, 116, 131, 165, 207, 236 y 279 respectivamente.

Estos catorce casos corresponden al nmero de valores tres (3) que nos
indicaba la tabla de frecuencias. Es de gran importancia anotar el nmero del
caso, para poder determinar la encuesta a la que corresponde. En nuestro
archivo, el nmero de encuesta coincide con el nmero de fila, por lo que ya
tenemos los nmeros de los formularios en que debemos buscar los errores.

Antes de subsanar los errores de la variable Gnero, conoceremos el segundo


mtodo de bsqueda, con lo valores errneos de la variable Estado civil. Para
realizar la identificacin de los casos por medio de filtros, es necesario recurrir
alprocedimiento Seleccionar casos. Para activar este procedimiento, debemos
ir al men Datos y escoger la opcin Seleccionar casos [Fig.3-129]; al
hacer clic sobre la opcin, aparece el cuadro de dilogo correspondiente [Fig.3-
130], en donde aparecen todas las opciones de seleccin con que cuenta el
programa.

Figuras 3-129 y 3-130

Este cuadro esta compuesto por cuatro secciones; la primera corresponde a


la lista de variables, en donde aparecen todas las variables con que cuenta el
archivo. La segunda seccin corresponde a Seleccin, en donde encontramos
los cinco procedimientos de filtrado del programa. La tercera seccin
corresponde al Estado del filtro, donde aparece una leyenda informativa que
nos indica el estado actual de la seleccin de casos.

La ltima seccin del cuadro corresponde a las Opciones de los casos no


seleccionados, en donde encontramos dos posibilidades (Filtrarlos o
Eliminarlos); es recomendable utilizar siempre la opcin filtrar ya que si
elegimos la opcin eliminar, no podremos recuperar los casos borrados.
Para activar alguno de los mtodos de seleccin, debemos hacer clic sobre l
de manera que aparezca un punto en la casilla de seleccin y se active el
botn ubicado en la parte inferior del mtodo.

Dentro de los mtodos de seleccin encontramos cinco posibilidades; Todos


los casos, es la opcin que por defecto utiliza el programa, al seleccionarla se
pierden los filtros que se hayan creado con anterioridad y los resultados,
procesos procedimientos se realizarn con la totalidad de los casos.

La segunda opcin corresponde a Si satisface la condicin, este mtodo utiliza


una expresin condicional para seleccionar los casos; si el resultado de la
expresin condicional es verdadero, el caso se selecciona y si el resultado de
la expresin es falso o se trata de un valor perdido, entonces el caso no se
selecciona. Al hacer clic en el botn (Si) de esta opcin, aparece el cuadro de
dilogo correspondiente [Fig.3-131], en donde se debe definir la ecuacin
condicional.
Figura 3-131

Este cuadro esta dividido en tres secciones, la primera corresponde al listado


de variables que contiene el archivo; la segunda a la casilla de ecuacin, en
donde se debe introducir la expresin que se utilizar como filtro y la tercera la
compone lacalculadora de SPSS. Esta calculadora es comn en varios de los
cuadros de dilogo del paquete por lo que aprovecharemos la oportunidad y
vamos a explicar su funcionamiento en la siguiente leccin.

Calculadora de SPSS - Depurar 3ra Parte


Esta calculadora es comn en varios de los cuadros de dilogo del paquete por
lo que aprovecharemos la oportunidad y vamos a explicar su funcionamiento.
La calculadora de SPSS se divide en dos partes; la primera la comprende los
operadores aritmtico-lgicos y el teclado numrico [Fig.3-132] y la segunda es
lalista de funciones [Fig.3-133].

Dentro de los operadores aritmticos encontramos la Suma (+), Resta (-


),Multiplicacin (*), Divisin (/) y el Exponencial (**). A su vez los operadores
lgicos con que cuenta la calculadora son Menor que (<), Mayor
que (>), Menor o igual(<=); Mayor o igual (>=), Igual (=), Diferente ( =), Y
lgico (&) [este operador da como resultado verdadero si tanto el termino
precedente como el que le sigue son verdaderos, los trminos pueden ser
lgicos o numricos]; O lgico ( | ) [este operador da
como resultado verdadero si el termino precedente el siguiente tambin lo
son, los trminos pueden ser lgicos o numricos]; Negacin lgica ( )
[este operador da verdadero si el termino siguiente es falso; los trminos
pueden ser lgicos o numricos]; Agrupacin ( ) [los operadores
y funciones que aparecen dentro del parntesis se realizan antes de los que
estn fuera].
Figuras 3-132 y 3-133

La segunda parte de la Calculadora de SPSS la compone


la lista de funciones de transformacin disponibles [Fig.3-133]. Para emplear
una funcin, debemos seleccionarla de la lista y hacer clic en el botn de
flecha para pegar la funcin en la expresin. Despus de pegar la funcin,
se debe completar la expresin introduciendo valores en todos los signos de
interrogacin existentes en la funcin.

Si desea consultar una descripcin de las funciones, coloque el puntero del


ratn sobre la funcin de inters y pulse el botn derecho del ratn, con lo
que surgir una pequea leyenda informativa. Dentro de las funciones con
que cuenta la calculadora de SPSS encontramos las
expresiones Aritmticas, Estadsticas, de Cadena,Fecha y hora, de
Distribucin, de Variables aleatorias y de Valores perdidos. En el sistema de
ayuda (Temas) encontraras una lista completa de las funciones, as como
una breve descripcin de su funcionamiento.

Continuando con el ejemplo vamos a ingresar la expresin que necesitamos


para seleccionar solo los casos que contienen valores errneos en la
variable Estado civil (Estciv). Para realizarlo, debemos primero identificar los
valores que representan errores; si nos fijamos en la tabla de frecuencias de
la variable, notaremos que estos valores son 0, 7 y 10. Dado que los valores
estn muy dispersos es necesario pedirle al programa que seleccione cada
uno de estos valores, a travs de la expresin (Estciv = 0 Estciv = 7
Estciv = 10).

Para lograrlo, debemos sealar en la lista la variable Estciv y la ingresamos


en la casilla de expresin haciendo clic en el botn Flecha ( ). Una vez
ingresa la variable, nos dirigimos al teclado de la calculadora y
seleccionamos el botn Igual (=) haciendo clic sobre l y sucesivamente
ingresamos el nmero cero (0) con lo que obtenemos en la casilla de
expresin la ecuacin (Estciv = 0).

Esta expresin nos garantiza que los valores cero sern seleccionados;
paracontinuar debemos seleccionar en la calculadora el conector logico O ( |
). Sucesivamente ingresamos la expresin del segundo nmero (Estciv = 7),
con lo que obtenemos en la casilla de expresin la ecuacin (
). En este caso el conector O lgico, le informa al programa que seleccione
los casos que cumplan con una de las expresiones que aparecen antes y
despus del conector.

Para continuar, ingresamos nuevamente el conector O Lgico y


sucesivamente ingresamos la expresin del tercer nmero (Estciv =10), con
lo que obtenemos la expresin ( ) [Fig.3-134].
Despus de ingresar la expresin hacemos clic en Continuar, con lo que
volveremos al cuadro de dilogo Seleccionar casos [Fig.3-135], note como
una vez se define una expresin de condicin, la ecuacin aparece al
costado derecho del botn (Si..). Aprovechando la presencia del cuadro de
dilogo del procedimiento Seleccionar casos, vamos a conocer los otros
mtodos que se pueden utilizar.

Figuras 3-134 y 3-135

El tercer mtodo de seleccin corresponde a Muestra aleatoria de casos,


como su nombre lo indica este procedimiento nos permite extraer una
muestra de los casos; ya sea basndonos en un porcentaje concreto de los
casos o por medio de un nmero especfico de casos. Al hacer clic en el
botn Muestra, aparece el cuadro de dilogo correspondiente [Fig.3-136].

Figura 3-136

Al seleccionar la primera de las opciones (porcentaje de los casos), el


programa aproxima el valor del porcentaje al nmero entero de casos ms
cercano. Al seleccionar la segunda opcin (nmero exacto de casos), el
programa escoge los valores de los primeros casos del archivo; es decir, de
los casos que se encuentren en las filas iniciales del archivo.

El cuarto mtodo de seleccin corresponde a Basndose en el rango de


tiempo de los casos, esta opcin nos permite definir los limites (Superior e
Inferior), entre los cuales se escogern los casos. Al hacer clic sobre el
botn Rango, aparece el cuadro de dilogo correspondiente [Fig.3-137]. En
este cuadro aparecen dos casillas, en donde debemos ingresar los valores
del primer caso y el ltimo caso que ser seleccionado. Los valores de
estas casilla pueden ser numricos ofechas/horas. Los rangos de fechas o
de tiempos slo estarn disponibles para los datos de series temporales con
variables de fecha ya definidas (men Datos, Definir fechas).

Figura 3-137

El ltimo mtodo lo compone Usar variable de filtro, el cual emplea una


variable numrica cuyos datos determinan los casos seleccionados. Todos
los casos de la variable de filtro que cuenten con cualquier valor distinto del
cero (0) o del valor perdido por el sistema (Vaci), sern seleccionados.
Para utilizar este mtodo, es necesario ingresar una variable en la casilla
ubicada en la parte inferior de la opcin, haciendo clic en el botn Flecha.

Por el momento seleccionaremos nuevamente la primera opcin Si satisface


la condicin; en la siguiente leccin continuaremos con la depuracin de
Datos con SPSS.

Seleccionar casos en SPSS - Depurar Datos


Fin
Para continuar con el ejemplo seleccionamos nuevamente al opcin Si
satisface la condicin y sucesivamente hacemos clic en el
botn Aceptar, con lo que aparecen en la columna de casos del editor de
datos una serie de rayas [Fig.3-138], estas rayas identifican los casos que
no cumplen con la condicin y por lo tanto no son seleccionados. Note que
en la parte final del archivo, aparece una nueva variable denominada (filter
$). Esta variable contiene un valor cero (0) para los casos que no fueron
seleccionados y un valor uno (1) para los que si lo fueron.
Figura 3-138

Para poder identificar las encuestas (Casos) que contienen valores errneos,
es necesario generar una tabla de frecuencias para la variable Nmero de
encuesta (ID); para realizarlo nos dirigimos a la barra de herramientas y
seleccionamos el botn Recuperar cuadros de dilogo ( ). Al hacer clic sobre
l, aparece un listadode los cuadros de dilogo de los procedimientos que se
han ejecutado en el programa, de acuerdo al orden inverso de utilizacin; es
decir, el ltimo procedimiento realizado aparece en la primera posicin [Fig.3-
139].

Figuras 3-139 y 3-140

En este listado buscamos el procedimiento Frecuencias y hacemos clic sobre


l, con lo que aparecer el cuadro de dilogo correspondiente [Fig.3-140], si
nos fijamos en el listado de variable, notaremos que ahora aparece una nueva
variable llamada filter_$, esta variable contiene los casos que son
seleccionados. Mientras esta variable exista los resultados de los procesos
o procedimientos que se realicen con el programa, estarn basados slo en los
casos seleccionados.

Para continuar con el ejemplo, hacemos clic en el botn Restablecer, de modo


que todas las variables seleccionadas aparezcan nuevamente en el listado. A
continuacin ingresamos la variable ID en la casilla de seleccin y
hacemos clic enAceptar, con lo que se generara en el visor de resultados, la
tabla de frecuencia para los casos que estn seleccionados; es decir, aquellos
que contienen valores errneos para la variable Estciv [Fig.3-141]. Lo
realmente til de esta tabla son los Nmeros de caso ya que con ellos
podemos identificar la encuesta a la que corresponden, de lo que podemos
determinar que los valores errneos de la variable Estaciv corresponden a los
casos 31, 88, 135, 185, 245 y 278 respectivamente.

Figura 3-141

Despus de determinar los nmeros de encuesta es necesario ir a la fuente


(formularios de encuesta) y buscar las respuestas adecuadas para cada uno de
los valores. Para facilitar esta labor, hemos incluido en la tabla de la figura [3-
142], los nmeros de caso, los valores errneos y los valores adecuados para
la variable Gnero; a su vez, en la tabla de la figura [3-143], se encuentran los
mismos datos pero para la variable Estado civil.

Figura 3-137

Una vez detectados los valores correctos, debemos volver al editor de datos y
corregir cada uno de los casos. Despus de efectuar la correccin es necesario
guardar los cambios realizados antes de comenzar con el anlisis de la
informacin. Hay que notar que el procedimiento Seleccionar casos slo es
efectivo cuando existe una variable de identificacin dentro de los datos; por
este motivo es recomendable generar una variable de identificacin en el
momento que se crean los archivos.

A pesar que la depuracin de los datos es el proceso ms extenso y tedioso del


anlisis y generacin de reportes, es indispensable realizar siempre la
correccin de los errores, ya que de lo contrario los resultados del anlisis
pueden sufrir graves alteraciones, al punto que las conclusiones que se
obtengan de la informacin sean totalmente contradictorias con la realidad. Por
ejemplo supongamos que tenemos diez datos representativos del gnero de
los entrevistados donde los valores slo pueden tomar los estados Hombre = 1
y Mujer = 2.

Gnero = (1, 1, 2, 2, 2, 3, 3, 3, 3, 3)

Si asumimos que los valores 3 son mujeres el resultado seria que el 80% de los
entrevistados son mujeres y si tomamos el valor 3 como hombre obtendramos
que el 70% de los entrevistados son hombres, en ambos casos estaramos
cometiendo un error y los resultados del anlisis van a salir distorsionados.

A simple vista los resultados no son tan graves pero si asumimos que esta
informacin proviene de una encuesta realizada por una empresa que se
dedica a la fabricacin y comercializacin de maquinas de afeitar y este gnero
representa los compradores habituales del producto; el asumir que los valores
3 son mujeres nos indicara que nuestros usuarios son las mujeres y por tanto
deberamos dirigir todos nuestros esfuerzos de mercadotecnia hacia este
sector, lo cual podra causar serios problemas en las ventas de la empresa.

CAPITULO IV

TRANSFORMAR DATOS SPSS - CURSO GRATIS

Una de las principales ventajas de SPSS, radica en la capacidad de generar


nueva informacin a partir de los datos originales del archivo de trabajo. Esta
propiedad nos permite manipular la informacin contenida en las variables, ya
sea para facilitar la interpretacin de los resultados, crear nuevas variables que
recopilen de forma general la informacin de varias variables, generar nuevas
variables que categoricen los datos de Escala adaptar la informacin para
que cumpla con los requerimientos de los procesos estadsticos.

Para la modificacin de la informacin SPSS cuenta con una serie de


procedimientos, cuya aplicacin depende de las necesidades del anlisis o del
criterio del investigador. Dentro de los mtodos de transformacin encontramos
laRecodificacin Automtica, Categorizar variables, Categorizador
visual,Recodificar en las mismas variables, Recodificar
en distintas variables, Contar apariciones y Calcular [Fig.4-1].

Figura 4-1

Es importante resaltar que antes de realizar transformaciones, es necesario


hacer una depuracin de los datos para evitar posibles errores en las nuevas
variables que se generen. Para comprender la metodologa empleada en los
procedimientos de transformacin, vamos a realizar un ejemplo con cada uno
de ellos, de modo que se expongan sus componentes y los pasos que se
deben ejecutar.

Para esta labor, emplearemos el archivo encuesta.sav, ubicado en


la carpetaCaptulo4 que se incluye en el CD adjunto. Antes de realizar alguna
transformacin es indispensable abrir el archivo ya sea pro medio de la
ruta Archivo..Abrir..Datos, mediante el botn Abrir ( ) ubicado en la barra
de herramientas. Una vez aparece la informacin del archivo en el editor de
datos de SPSS, estamos listos para iniciar.

Indice Temtico - Captulo IV: Transformar Datos en SPSS


Leccin 1 Recodificacin Auto
Leccin 2 Categorizar Variables
Leccin 3 Categorizador Visual
Leccin 4 Partes Categorizador
Leccin 5 Crear Rangos manual
Leccin 6 Crear Puntos de Corte
Leccin 7 Rangos por Media
Leccin 8 Recodificar Variables
Leccin 9 Valor Nuevo y Antiguo
Leccin 10 Definir Valores
Leccin 11 Condicionar Casos
Leccin 12 Mtodos Recodificar
Leccin 13 Contar Apariciones
Leccin 14 Calcular de SPSS
Leccin 15 Ejemplo Aplicativo
Leccin 16 Ejemplo Aplicativo 2
Leccin 17 Calcular Nivel general

Recodificacin Automatica de SPSS


En algunas ocasiones, la informacin contenida en las variables se
encuentra en formato de texto, lo cual impide que SPSS pueda realizar
clculos estadsticos con ella. Para superar este inconveniente, es
necesario transformar la informacin, de manera que se le asigne un valor
numrico a cada una de las frases representativas de la variable original.
Para esta labor, SPSS cuenta con un procedimiento que nos permite
asignar de forma automtica un valor numrico a cada categora (Frase),
que se encuentre dentro de la variable, el cual va incrementndose de uno
en uno hasta terminar la totalidad de las frases o categoras.

La Recodificacin automtica crea una nueva variable, la cual conserva las


propiedades de la variable original como el tipo, el ancho, los decimales, la
etiqueta, el nivel de medida, los valores perdidos o las etiquetas de valor. En el
caso que los valores no tengan etiquetas definidas dentro de la variable
original, la recodificacin automtica emplea los valores antiguos como
etiquetas de valor para la variable de resultado.

Los valores de cadena (Caracteres alfanumricos) se recodifican por orden


alfabtico, con las maysculas antes que las minsculas; a su vez, los valores
perdidos definidos por el usuario se recodifican como valores superiores a los
no perdidos conservando su orden; es decir, se le asignan los valores ms
altos dentro de la variable de resultado de acuerdo con el nmero de valores
perdidos que se hayan definido en la variable de origen.

Para comprender el funcionamiento de este procedimiento, vamos a generar un


ejemplo en donde se expongan los pasos que se deben ejecutar, as como
losresultados que se obtienen. Para activar el procedimiento debemos ir al
menTransformar y seleccionar la opcin Recodificacin automtica [Fig.4-2];
al hacer clic sobre la opcin aparece el cuadro de dilogo correspondiente
[Fig.4-3]. A travs de este cuadro debemos definir cada uno de los parmetros
de las variables de origen y resultado.

Figuras 4-2 y 4-3

Este cuadro de dilogo se encuentra dividido en cuatro secciones; en la


primera encontramos un listado de las variables con que cuenta el archivo, la
segunda corresponde a la casilla de seleccin en donde se ingresan las
variables que deseamos recodificar. La tercera seccin corresponde a la
variable de resultado, en donde encontramos una casilla en la que
debemos ingresar las letras del nombre de la variable de resultado; esta casilla
no se activar hasta que se haya ingresado a la casilla de seleccin por lo
menos una variable. Por ltimo encontramos la seccin correspondiente a las
opciones de recodificacin, donde debemos definir el orden de recodificacin,
ya sea del Menor valor (la Recodificacin se realiza en orden ascendente)
Mayor valor (la Recodifica se efecta en orden descendente).

Continuando con el ejemplo, vamos a recodificar la variable Gnero la cual


contiene la informacin correspondiente al sexo del encuestado. Si nos fijamos
en el editor de datos, notaremos que los valores de esta variable son
caracteres alfabticos que asumen los valores F (Femenino) y M (Masculino);
note que en la lista de variables aparece la variable Gnero precedida de un
icono diferente ( ), el cual nos indica que la variable es del tipo Cadena. Para
recodificar los valores de esta variable, lo primero que debemos hacer es
seleccionarla en el listado de variables y posteriormente hacer clic en el icono
flecha ( ) para que ingrese en la casilla de seleccin; una vez ingresada, le
asignamos un nombre para lo cual en la casilla deNuevo nombre escribimos la
palabra Sexo y sucesivamente hacemos clic en el botn Aadir nuevo nombre,
con lo que la frase aparece al frente de la variable Gnero dentro de la casilla
de seleccin (GNERO Sexo).

Despus asignarle el nuevo nombre slo nos resta elegir una de las opciones
delorden de recodificacin que en nuestro caso ser Menor valor [Fig.4-4]; para
finalizar hacemos clic en el botn Aceptar, con lo cual la nueva variable se
genera en la parte final del editor de datos [Fig.4-5]. Esta variable se conforma
con los valores uno (1) para el gnero Femenino y dos (2) para el
gnero Masculino.

Figuras 4-4 y 4-5

De igual manera, SPSS genera una tabla en el visor de resultados en el que


nos informa los cambios realizados [Fig.4-6]; dentro de estos cambios
encontramos los valores originales, los nuevos valores y las etiquetas de valor
de la variable deresultado. Este procedimiento se puede realizar con mltiples
variables de forma simultnea, con la nica condicin que las recodificaciones
se generan con el mismo formato de ordenamiento, ya sea de
forma ascendente o descendente. Para realizar ms de una recodificacin a la
vez, es necesario ingresar a la casilla de seleccin cada una de las variables y
asignarles el nuevo nombre; el procedimientono habilita el botn Aceptar hasta
que se le declare un nuevo nombre a cada una de las variables seleccionadas.

Figura 4-6
En conclusin la Recodificacin automtica nos permite cambiar los valores de
una variable numrica o de cadena por valores enteros consecutivos, lo cual
nos garantiza que se pueden realizar clculos estadsticos con esta
informacin. Esteprocedimiento es ideal para la transformacin de las variables
de cadena a variables numricas, ya que el programa convierte los antiguos
valores de la variable de origen en etiquetas de valor para la variable
de resultado. Es necesario destacar que el procedimiento se efecta en orden
alfabtico y las maysculas tienen prelacin a las que comienzan con
minsculas.

En resumen, los pasos que se deben ejecutar para realizar una recodificacin
automtica son:
Activar el procedimiento [en el men Transformar seleccionamos la
opcin Recodificacin automtica].
Seleccionar la (s) variable (s) [en el listado de variables escogemos las
variables de inters y las ingresamos a la casilla de seleccin;
generalmente son variables con caracteres alfanumricos].
Definir el nombre de la (s) variable (s) de destino [seleccionar la variable
de inters e ingresar el nombre en la casilla; para finalizar hacer clic en el
botn Aadir nuevo nombre].
Definir el orden de recodificacin [Activar alguno de los mtodos de
ordenamiento Menor valor Mayor valor]
Ejecutar la recodificacin automtica [Hacer clic en el botn Aceptar].

Categorizar Variables con SPSS


En la mayora de los casos, las bases de datos cuentan con variables cuya
informacin representa cantidades o magnitudes como la edad, los
ingresos, las ventas, etc. Generalmente este tipo de variables no son actas
para realizar tablas de frecuencia, debido a su elevado nmero de valores.
SPSS nos ofrece la posibilidad de reunir esta informacin dentro de rangos
representativos, que vinculen una gran cantidad de valores y cuyos
resultados son ingresados en una nueva variable, lo que nos permite
mantener la informacin original intacta.

Para esta labor, SPSS cuenta con el procedimiento Categorizar Variables (Slo
versiones anteriores a la 12.0), el cual convierte los datos de una variable de
escala (Valores numricos que representan cantidad), en un nmero discreto
de categoras; es decir, rene un grupo de valores y les asigna un nmero
representativo de categora de pertenencia. Los nuevos valores son guardados
en una nueva variable la cual se identifica con el nombre original precedido de
la letra ene (n); por ejemplo la variable Altura al ser categorizada
quedara naltura. Si cuentas con la versin 12.0 omite este apartado y pasa al
siguiente, ya que esta nueva versin (12.0), cuenta con un procedimiento de
categorizacin mejorado, que nos ofrece mayor asistencia.

Para realizar la categorizacin, el programa conforma los grupos de acuerdo


con los percentiles (fracciones del porcentaje total), por lo que cada grupo
contiene aproximadamente el mismo nmero de casos. Por ejemplo, si le
especificamos al programa la creacin de cuatro (4) grupos, el asignar el valor
1 a los casos situados bajo el percentil 25 o los casos comprendidos desde el
menor valor hasta el valor que se encuentre aproximadamente en el 25% del
total de los casos.

El valor 2 a los casos entre el percentil 25 y 50; es decir, a los valores


correspondientes desde el nivel anterior hasta el valor que se encuentre en el
50% del total de los casos. El valor 3 a los casos situados entre el percentil 50
y 75 y el valor 4 a los casos por encima del percentil 75. Por ninguna razn un
valor puede estar representado en dos categoras diferentes, sin importar si
este valor produce un porcentaje mayor o menor del establecido; es decir, si un
valor se encuentra entre el 42% y el 57% de los casos, el programa no
selecciona la mitad, sino el nmero que se encuentre en el limite inferior o
superior de este valor.

Para comprender el funcionamiento de este procedimiento, vamos a generar un


ejemplo con la variable edad del archivo Encuesta.sav. Para acceder al
procedimiento, debemos dirigirnos al men Transformar y seleccionar la
opcinCategorizar Variables [Fig.4-7]; al hacer clic sobre l, aparece el cuadro
de dilogo correspondiente [Fig.4-8]. A travs de este cuadro, debemos definir
la (s) variable (s) que deseamos categorizar, as como el nmero de categoras
que deseamos obtener en la variable de resultados.

Figuras 4-7 y 4-8

Este cuadro de dilogo esta dividido en tres secciones; la primera corresponde


a la lista de variables existentes en el archivo, la segunda a la casilla de
seleccin y la tercera seccin corresponde al nmero de categoras que
deseamos generar; a la derecha de esta seccin encontramos una casilla en la
cual debemos ingresar el nmero de categoras que deseamos obtener en la
nueva variable, teniendo en cuenta que esta asignacin se realiza de acuerdo
al porcentaje de los casos. Paracontinuar con el ejemplo vamos a categorizar
las variables Edad y Nmero de aos estudiados (Educaos).

Para realizarlo, debemos ubicar cada una de las variables dentro del listado e
ingresarlas a la casilla de seleccin haciendo clic en el botn Flecha ( ). Una
vez ingresadas las variables, slo nos resta definir el nmero de categoras que
aparecern en las variables de resultado, que para el caso corresponde a cinco
(5). Para definir la cantidad de categoras, activamos la casilla haciendo clic
sobre ella y sucesivamente introducimos el nmero cinco [Fig.4-9]. Para
finalizar hacemos clic en el botn Aceptar, con lo que las variables aparecen en
la parte final del editor de datos [Fig.4-10].

Figuras 4-9 y 4-10


Si nos fijamos en las nuevas variables creadas, notaremos que no cuentan con
las propiedades de la variable original y que a su vez las etiquetas de valor no
han sido definidas. Adems, si tratamos de identificar los valores limtrofes de
los rangos no lo podramos conseguir, ya que este procedimiento no nos
proporciona esta informacin. Para poder conocer los valores limtrofes de
cada uno de los rangos categricos, es necesario emplear los estadsticos
del procedimiento Frecuencias.

Por el momento no profundizaremos en la forma de obtener los lmites de los


rangos, ya que en el captulo siguiente se explorar en su totalidad
el procedimientoFrecuencias. Para orientar al lector, le hemos pedido al
programa que nos ensee los valores de los percentiles 20, 40, 60 y 80 en las
dos variables, cuyos resultadosson expuestos en la tabla de la figura [4-11]. Si
nos fijamos en estos resultados, podremos determinar los rangos de las nuevas
variables Figura [4-12]..

Figura 4-11

Figura 4-12
En conclusin el procedimiento categorizar variables nos permite convertir
rpidamente una variable de Escala en una variable Ordinal, con la desventaja
que desconocemos los valores que involucra cada uno de los rangos; su
utilidad radica en la capacidad de organizar cada uno de las categoras con un
valor porcentual aproximadamente igual.

En resumen, los pasos que se deben ejecutar para categorizar variables son:

Activar el procedimiento [en el men Transformar seleccionamos la


opcin Categorizar variables].
Seleccionar la (s) variable (s) [en el listado de variables escogemos las
variables de inters y las ingresamos a la casilla de seleccin;
generalmente son variables de Escala].
Definir el nmero de categoras [Ingresar en la casilla el nmero de
categoras deseado]
Ejecutar la categorizacin [Hacer clic en el botn Aceptar].
Definir las etiquetas de valor para cada una de las categoras de las
nuevas variables generadas.
Categorizador Visual de SPSS
Para la versin 12.0 de SPSS se incluye un nuevo mtodo de categorizacin
mejorado, el cual no slo realiza la agrupacin de los valores de las variables
de escala, sino que adems nos permite agrupar variables categricas.
Esteprocedimiento emplea un asistente que nos orienta durante todo el
proceso de estructuracin de la nueva variable, a travs de una serie de
ventanas en las que se definen fragmentos especficos de los conjuntos de
agrupacin.

Este nuevo procedimiento nos ofrece varias alternativas para determinar los
lmites de cada grupo, ya sea por medio de intervalos de igual amplitud,
porcentajes o desviaciones tpicas. A travs de este nuevo procedimiento se
puede realizar lasopciones:

Crear variables categricas a partir de variables de escala continuas.


Por ejemplo, se puede utilizar una variable de escala que contenga los
ingresos para crear una variable categrica nueva que contenga intervalos
de ingresos.
Fusionar un nmero elevado de categoras ordinales en un conjunto
menor de categoras. Porejemplo, es posible reunir una escala de
evaluacin de nueve categoras en tres categoras que representen: bajo,
medio y alto.

Para comprender el funcionamiento de este nuevo procedimiento, vamos a


generar un ejemplo categorizando los datos de las variables Edad (Edad en
aos) y Educaos (Aos estudiados); adems agruparemos las categoras de
la variable Consalud (condicin de salud), en slo tres niveles. Para acceder
al procedimiento, debemos dirigirnos al men Transformar y seleccionar la
opcin Categorizador visual [Fig.4-13]; al hacer clic sobre ella, aparece el
cuadro de dilogo inicial delprocedimiento [Fig.4-14]. En este cuadro inicial se
deben definir las variables que deseamos categorizar, para lo cual
el procedimiento hace una exploracin previa de los datos que contiene cada
variable.

Figuras 4-13 y 4-14

En este cuadro inicial encontramos los componentes caractersticos de SPSS,


como la lista de variables; note que las variables de cadena y las variables
nominales no se muestran en el listado, esto se debe ha que el Categorizador
visual requiere que las variables sean numricas y tengan niveles de
medidaOrdinal o de Escala, ya que el procedimiento asume que los valores de
los datos cuentan con algn tipo de orden lgico que puede ser utilizado para
agruparlos.

La segunda seccin corresponde a la casilla de seleccin y la tercera seccin


corresponde a Limitar nmero de casos explorados. Para realizar la
categorizacin, el programa efecta primero una exploracin de los casos para
determinar los valores que pueden asumir cada una de las variables
seleccionadas. La limitacin de casos puede ahorrar tiempo, sobre todo si el
archivo cuenta con elevado nmero de casos, aunque es recomendable evitar
esta alternativa, ya que la distribucin de los valores puede verse seriamente
afectada si se realiza la categorizacin a travs de desviaciones tpicas.

Continuando con el ejemplo, vamos a ingresar las variables Edad, Educaos y


Consalud, por lo que debemos seleccionarlas en el listado de variables y
posteriormente hacer clic en el botn Flecha ( ) ubicado en el medio de las
casillas. Una vez se ingresan las variables, hacemos clic en el
botn Continuar con lo que aparece el cuadro de dilogo principal [Fig.4-15];
para activar las casillas de este cuadro es necesario seleccionar una de las
variables del listado, en nuestro caso optaremos por la variable Edad.

Figura 4-15

Este cuadro esta compuesto por mltiples secciones, cada una de ellas cumple
un objetivo especfico dentro de la definicin de los conjuntos de agrupacin.
La primera seccin del cuadro corresponde a la lista de variables [Fig.4-16]; en
esta casilla aparecen las variables que fueron seleccionadas en el cuadro de
dilogo inicial. Este listado se puede ordenar de acuerdo al nivel de medida
(de Escala uOrdinal) o por el nombre de las variables; pulsando en los
encabezados de las columnas Medida y Variables.
Figuras 4-16 y 4-17

La segunda seccin la componen los Casos explorados y


los Valores perdidos[Fig.4-17]; la primera casilla indica el nmero de casos que
fueron explorados para la variable activa. Todos los casos explorados
sin valores perdidos definidos por el usuario o del sistema, se emplean en la
generacin de la distribucin de valores del Categorizador visual. La segunda
casilla (Perdidos), nos indica el nmero de casos explorados
con valores perdidos definidos por el usuario y perdidos del sistema. Es
importante resaltar que los valores perdidos no son incluidos en ninguno de los
intervalos de la nueva variable.

En la siguiente leccion continuaremos con las siguientes partes del cuadro de


dialogo del Procedimiento Categorizador Visual de SPSS.

Partes del Categorizador Visual de SPSS


La tercera seccin la componen las opciones de variable [Fig.4-18]; dentro de
estas opciones encontramos el nombre y la etiqueta de la variable actual, as
como dos casillas para definir el nombre y la etiqueta de la variable
de resultado. Por defecto el programa aplica a la variable de resultado la misma
etiqueta de la variable de origen, pero le anexa la palabra Categorizada. De
igual forma, en esta seccin encontramos las casillas Mnimo y Mximo, las
cuales nos informan losvalores extremos de la variable activa;
estos valores son hallados a travs de la exploracin de los datos.

Figura 4-18

La cuarta seccin del cuadro la compone la representacin grafica de


los valoresno perdidos [Fig.4-19]; en esta seccin encontramos un histograma,
el cual muestra la distribucin de valores tiles correspondiente a la variable
seleccionada actualmente, basndose en los casos explorados. En
este histograma, el mnimo y el mximo se basan en los casos explorados. Si
no incluyen todos los casos en la exploracin, es posible que no se refleje con
precisin la distribucin real, sobre todo si el archivo se orden de
forma ascendente o descendente antes de realizar la categorizacin.

Figura 4-19

La cuarta seccin la compone la Rejilla de intervalos [Fig.4-20]; en esta seccin


se definen los puntos de corte superiores de cada intervalo, as como las
etiquetas de valor opcionales para cada rango. En la parte superior de la rejilla
encontramos las columnas Valor y Etiqueta. En la columna Valor, se deben
introducir los valores de corte de cada intervalo si se desea, permitir que el
programa los genere automticamente basndose en los criterios que se le
definan.

Por defecto, se incluye automticamente dentro de la columna un punto de


corte con el valor SUPERIOR. Este intervalo contendr cualquier valor no
perdido que se encuentre por encima del ltimo punto de corte definido; a su
vez el primer intervalo definido por el punto de corte inicial, incluir todos
los valores que sean menores o iguales a dicho nmero. En la columna
Etiquetas se deben ingresar las leyendasinformativas que describan
los valores de la nueva variable categorizada.

Puesto que los valores de la nueva variable slo sern nmeros enteros
consecutivos, las etiquetas de valor surgen como una opcin bastante til,
sobre todo en los resultados de los procedimientos que se realicen con esta
nueva variable, ya que le proporciona al usuario orientacin sobre los rangos
que componen cada intervalo. Las etiquetas pueden ser introducidas
manualmente o mediante la opcin Crear etiquetas, con lo que se generan de
forma automtica.

Figura 4-20

La quinta seccin de este cuadro la componen las opciones de procedimiento;


dentro de estas opciones encontramos la propiedad Limites Superiores [Fig.4-
21]; esta propiedad controla el tratamiento de los valores de los lmites
superiores introducidos en la columna Valor de la rejilla. Si se selecciona la
opcin Incluidos[<=], los casos que cuenten con el nmero especificado en la
casilla Valor sern incluidos en el intervalo. Por ejemplo, si se especifica el
nmero 25 dentro de la casilla Valor, los casos con el valor exacto 25 se
incluirn en el intervalo.
Si por el contrario se activa la opcin Excluidos [<], los casos que cuenten con
el nmero especificado en la casilla Valor no sern incluidos en el intervalo y se
tomaran nicamente los valores que estn por debajo del nmero especificado.
Porejemplo, si define el nmero 25, los casos con el valor exacto (25) se
excluyen del primer intervalo, de esta forma se incluirn todos los casos con
valor menor a 25.

Figuras 4-21 y 4-22

Las otras opciones de esta seccin corresponden a Crear puntos de


corte [Fig.4-22]; al activar esta opcin aparece un nuevo cuadro de dilogo, por
medio del cual podemos pedirle al programa que genere las categorizacin, ya
sea por intervalos de igual amplitud, Percentiles iguales basados en la
exploracin de los casos mediante puntos de corte basados en la media y la
desviacin tpica de los casos explorados. Simultneamente, aparece en esta
casilla la opcin Crear etiquetas; al activarla, el programa
genera leyendas descriptivas para los valores enteros contenidos en la nueva
variable categorizada, de acuerdo al tratamientoespecificado para los lmites
superiores (incluidos o excluidos).

La ltima opcin corresponde a Invertir escala; al activarla los valores de la


variable de resultado asumen el orden inverso al que aparece en la rejilla.
Por ejemplo, si en la rejilla aparecen los valores 1=Bajo, 2=Medio y 3=Alto,
al activar la opcin estosvalores aparecern en la variable de resultado como
1=Alto, 2=Medio y 3=Bajo.

La ltima seccin del cuadro la compone la propiedad Copiar categoras [Fig.4-


23]. Por medio de estas opciones, podemos extraer las especificaciones de
categorizacin definidas para la variable actual y aplicrselas a otras variables
(A otras variables) extraer la categorizacin de una variable externa y
aplicrsela a la variable actual (De otra variable).

Figura 4-23

Para comprender cada uno de los elementos que componen el procedimiento


Categorizador Visual de SPSS, en la siguiente leccin vamos a realizar la
categorizacin de las variables Edad, Educacion en Aos y Consalud.

Asignar Rangos de Forma Manual en SPSS


Para comprender los elementos que componen el procedimiento, vamos a
realizar la categorizacin de las variables que seleccionamos en el cuadro de
dilogo inicial. Comenzaremos el proceso con la variable Educaos, por lo que
debemos hacer clic sobre ella en el listado de variables, con lo que los
componentes del cuadro se actualizan de acuerdo a los datos explorados para
la variable. Si nos fijamos en el histograma de distribucin [Fig.4-24],
notaremos que los valoresvaran desde cero (0) hasta veinte (20).

Figura 4-24

El categorizador visual nos ofrece dos formas para generar los intervalos
(Manual o Automatico); para la variable Educaos, vamos a emplear el
mtodo manual, por lo que debemos asignar los rangos antes de introducir
los puntos de corte superior. Dado que esta variable representa los aos de
educacin con que cuenta cada uno de los entrevistados, vamos a crear
tres rangos; el primero rene toda la educacin
Bsica (Primaria, Secundaria y Preparatoria), para este nivel se requiere
cursar once aos (11).

El segundo nivel corresponde a Profesional, para el que se requiere cinco


aos (5) y el ltimo nivel corresponde a Especializacin en donde se renen
los diplomados, Postgrados, Master y Doctorados; dado que el tiempo
empleado para cada uno de estos estudios es distinto, le pediremos al
programa que agrupe todos los valores que superen los diecisis aos (16)
de estudio. De acuerdo a estos niveles los puntos de corte quedaran
ubicados en once (11) y diecisis (16), respectivamente.

Para ingresar los puntos de corte, debemos ir a la seccin Rejilla y


hacer clic sobre la casilla vaca de la columna Valor, de modo que
se resalte con un marco negro [Fig.4-25]. Una vez se activa la casilla
ingresamos el nmero once (11) y posteriormente hacemos clic en la casilla
de la columna Etiqueta, con lo que el valor once pasa a la fila nmero uno
de la rejilla [Fig.4-26].

Figuras 4-25 y 4-26

Para ingresar el segundo punto de corte, realizamos la misma operacin; es


decir, activamos la casilla de la fila 3, e ingresamos el nmero 16; para
terminar hacemosclic en la columna Etiqueta, de manera que el valor 16
pase a la Fila nmero dos [Fig.4-27]. Por ltimo, slo nos resta ingresar las
etiquetas de valor para cada uno de los intervalos; para realizarlo basta con
activar la respectiva casilla e ingresar las letras. Despus de declarar las
etiquetas obtenemos los resultados de la figura [4-28].

Figuras 4-27 y 4-28

Si nos fijamos en el histograma, notaremos que a medida que definimos los


puntos de corte, van apareciendo unas lneas indicativas [Fig.4-29]. Estas
lneas nos permiten modificar los puntos de corte de forma manual,
haciendo clic sobre una de ellas y mantenindolo el botn oprimido
podemos desplazar la lnea seleccionada hacia el costado que deseemos,
lo cual es de gran utilidad si no se tiene claro los limites de los intervalos, ya
que nos permite ir modificando los puntos hasta obtener los resultados
deseados. El programa le asigna el color rojo a la lnea que esta
seleccionada en el momento. De igual manera, podemos notar que el
nivel Bsicoabarca desde el nmero cero hasta el nmero 11, el
nivel Profesional abarca desde el nmero 12 hasta el nmero 16 y el
nivel Especializacin abarca todos losvalores superiores a 16 (17, 18, 19,
20, etc).

Figura 4-29

Despus de definir los puntos de corte, slo nos resta asignar el nombre y la
etiqueta a la nueva variable, para facilitar el reconocimiento de esta variable,
le asignaremos el nombre Rangeduc y la etiqueta Rangos de Educacin.

En la siguiente leccin continuaremos definiendo los puntos de corte de la


variable Edad; pero en esta ocasion conoceremos los metodos que contiene
elprocedimiento para la asignacin automatica de los puntos de corte.

Crear Puntos de Corte Automaticamente


Una vez definidos todos los parmetros de la nueva variable categorizada,
podemos continuar con la variable Edad, para lo que hacemos clic sobre
ella en la lista de variables, de manera que los datos del cuadro se
actualicen y nos muestren los resultados de la exploracin de esta variable.
Si nos fijamos en los valores Mnimo y Mximo, notaremos que los datos
varan entre los valores 18 y 44, lo que nos indica que contamos con una
amplitud de 26. Dado que en la variable anterior empleamos la
categorizacin manual, vamos a utilizar en la variable Edad el mtodo de
categorizacin automtica, con el fin de conocer las diferentes opciones que
nos ofrece el procedimiento.

Para acceder al mtodo de categorizacin automtica, debemos


hacer clic en el botn Crear Puntos de corte, con lo que surge el cuadro de
dilogo correspondiente [Fig.4-30]. En este cuadro encontramos los tres
mtodos de generacin de puntos de corte con que cuenta el programa. El
primero de ellos corresponde a Intervalos de igual amplitud, el cual genera
categoras con la misma distancia entre los limites del rango (por ejemplo,
110, 1120, 2130, etc.).

Figura 4-30

Para determinar los intervalos, el programa requiere que le definamos por lo


menos dos de los tres criterios del procedimiento [Fig.4-31]. El primero de
estos criterios corresponde a Posicin del primer punto de corte; este valor
define el lmite superior de la primera categora o categora inferior
(por ejemplo, el valor 10 indica un intervalo que incluye todos los valores
hasta 10). El segundo criterio corresponde a Nmero de puntos de
corte; este valor identifica el nmero de intervalos que deseamos obtener,
es necesario saber que el programa generar los intervalos
correspondientes al nmero de puntos de corte definidos ms uno.
Por ejemplo, 9puntos de corte generan 10 intervalos.
El tercer criterio corresponde a Amplitud, el cual define la longitud de cada
intervalo. Por ejemplo, el valor 10 categorizar la variable Edad en
intervalos de 10 aos. Adicionalmente el programa nos ofrece una casilla
informativa denominada Posicin del ltimo punto de corte; al frente de esta
casilla aparecer el valor numrico del ltimo punto de corte, de acuerdo a
los valores de criterio que se hayan definido.

Figura 4-31

Continuando con el ejemplo, vamos a pedirle al programa que genere


cuatro puntos de corte (Cinco intervalos) y que el primero de los puntos se
ubique en la posicin 24. Para realizarlo, debemos hacer clic en la casilla
correspondiente a Posicin del primer punto de corte e ingresar el valor 24,
sucesivamente ingresamos en la casilla Nmero de puntos de corte el valor
4; al hacer clic en la tercera casilla, automticamente aparecen los valores 5
en Amplitud y 39 en Posicin del ltimo punto de corte [Fig.4-32]; esto se
debe a que el programa slo requiere que se le especifiquen dos de los
criterios y con ellos calcula los dems.

Figuras 4-27 y 4-28

Una vez definidos los puntos de corte, se activa el botn Aplicar; al


hacer clic en l, se cierra el cuadro de dilogo y los valores de cada punto
de corte superior aparecen en la columna Valor de la seccin Rejilla [Fig.4-
33]. Note como el procedimiento automticamente nombre al ltimo
intervalo como Superior. Si nos fijamos en las lneas de corte del histograma
[Fig.4-34], notaremos cada uno de los intervalos; el primero va desde 1
hasta 24 (<=24), el segundo va desde 25 hasta 29, el tercero desde 30
hasta 34, el cuarto desde 35 hasta 39 y el ltimo recoge todos los valores
que superen los 40 aos.
Figura 4-29
Desde luego esta distribucin es el resultado del primer mtodo de
categorizacin automtica; para conocer los dems mtodos, vamos a
volver al cuadro de dilogo Crear puntos de corte, por lo que
hacemos clic sobre el botn correspondiente. Una vez aparece el cuadro
seleccionamos la segunda opcin, correspondiente a Percentiles iguales
basados en los casos explorados [Fig.4-35]; en este mtodo encontramos
slo dos criterios correspondientes al Nmero de puntos de corte y
Porcentaje de casos.

Al contrario que el mtodo anterior,


este procedimiento de percentiles genera intervalos con un nmero
aproximadamente igual de casos en cada categora y nicamente requiere
que se le defina uno de los criterios. Al definir el nmero de puntos de corte,
el programa genera los intervalos correspondientes al nmero de puntos de
corte ms uno. Por ejemplo, tres puntos de corte generan cuatro
categoras percentiles (cuartiles), conteniendo cada una el 25% de los
casos.

Figuras 4-35

Si por el contrario se definen los porcentajes de casos, el programa lo


asume como la amplitud de cada intervalo, expresado en el porcentaje total
de casos. Por ejemplo, el valor 33,3 generara tres categoras
(dos puntos de corte), conteniendo cada una el 33,3% de los casos. Es
necesario aclarar que si la variable de origen contiene un nmero
relativamente pequeo de valores distintos, o un gran nmero de casos con
el mismo valor, es posible que se obtenga menos categoras que las
solicitadas.

Continuando con el ejemplo, vamos a pedirle al programa que genere cinco


intervalos, por lo que debemos ingresar en la casilla Nmero de puntos de
corte el valor 4. Note como una vez se ingresa el nmero, aparece en la
casilla % de casos un valor porcentual [Fig.4-36], el cual representa el
promedio de casos que contendr cada uno de los intervalos.
Figura 4-36

Despus de definir los puntos de corte hacemos clic en Aplicar, con lo que
surge el aviso Se reemplazarn las definiciones de los puntos de corte
existente. Una vez hacemos clic en Aceptar, se cierra el cuadro y los valores
de cada punto aparecen en la columna Valor de la seccin Rejilla [Fig.4-37].
Si nos fijamos en los puntos de corte superior, notaremos que slo uno de
ellos cambia con respecto al mtodo anterior; en esta oportunidad el
primero de los puntos se ubica en el valor 25.

Figura 4-37
En la siguiente leccin conoceremos el ultimo metodo empleado para
asignar lospuntos de corte del Categorizador Visual de SPSS.

Rangos Por la Media y Desviaciones Tipicas


Por ltimo, vamos a conocer el mtodo correspondiente a Puntos de corte en
media y desviaciones tpicas seleccionadas [Fig.4-38]. Para acceder a l,
debemos volver al cuadro Crear puntos de corte, haciendo clic en el botn
correspondiente. Este procedimiento genera categoras basndose en los
valores de la media y la desviacin tpica de la distribucin de la variable activa.

Debemos recordar que la media es el promedio aritmtico de los datos y que la


desviacin tpica es una medida que nos informa que tan dispersos estn los
datos respecto al punto central (Media); desde luego este mtodo slo es
aplicable a las variables de Escala. El procedimiento nos ofrece tres
alternativas de seleccin +/- 1 Desv. Tpica, +/- 2 Desv. Tpica y +/- 3 Desv.
Tpica.

Figuras 4-38
Si no se selecciona ninguna de estas opciones, el programa genera slo dos
intervalos; el primero va desde el menor valor hasta la media y el segundo
desde el valor siguiente a la media hasta el mximo valor. Este mtodo nos
permite seleccionar cualquier combinacin de las opciones (1 y 2, 2 y 3, 1 y 3
1 2 y 3, etc.). Por cada opcin que se seleccione obtendremos dos intervalos
ms. Por ejemplo si seleccionamos las opciones 1 y 2 obtendremos seis
intervalos.

Para comprobarlo vamos a seleccionar las opciones [1 y 2] y sucesivamente


hacemos clic en Aplicar de manera que los puntos de corte superiores
aparecen en el histograma [Fig.4-39]. Si nos fijamos en los puntos de corte
notaremos que cada uno de ellos equivale al valor de las desviaciones y el
punto central equivale al valor de la media.

Figura 4-39

La utilidad de este mtodo se basa en que en una distribucin normal, el 68%


de los casos se encuentra dentro de una distancia de una desviacin tpica
respecto a la media, el 95% entre dos desviaciones tpicas y el 99% dentro de
tres desviaciones tpicas. Sin embargo la creacin de categoras basadas en
desviaciones tpicas puede ocasionar que los puntos de corte de algunas
categoras queden definidos fuera del rango real de los datos, e incluso fuera
del rango de valores posibles de los datos (por ejemplo, un rango de salarios
negativos). Si nos fijamos en los intervalos notaremos que el primero y el ltimo
no cobijan ninguno de los casos, por lo que son obsoletos para esta variable.

Dado que el mtodo ms preciso es el de percentiles, vamos a retomarlo


definiendo cuatro (4) puntos de corte superiores para los datos, de manera que
obtengamos intervalos con un porcentaje aproximadamente igual para todos.
Para realizarlo, debemos volver al cuadro Crear puntos de corte y definir
nuevamente los cuatro puntos en la seccin correspondiente (Percentiles); una
vez definidos hacemos clic en Aplicar de manera que aparecen los valores 25,
30, 34, 39 y Superior en la Rejilla.

Despus de definir los puntos de corte superior, es necesario introducir las


etiquetas; para esta labor el procedimiento nos ofrece la opcin de hacerlo en
forma automtica, mediante el botn Crear etiquetas. Al hacer clic en l
aparecen en la columna etiquetas, las leyendas informativas de cada intervalo
[Fig.4-40]. Si nos fijamos en las etiquetas, notares que el programa las genera
de forma numrica y que cada intervalo incluye el valor del punto de corte
superior dentro del rango.
Figuras 4-40 y 4-41

Para finalizar con la variable Edad, slo nos resta definirle un nombre a la
nueva variable, que en nuestro caso corresponde a Edadcat. Despus de
definir el nombre, seleccionamos la variable categrica (Ordinal) Condicin de
salud (Consalud), de manera que el contenido del cuadro se actualiza y nos
muestra losresultados de la exploracin.

Esta variable tiene cinco diferentes categoras [Fig.4-41], las cuales pueden ser
reunidas en tres. Para realizarlo, vamos a unir las categoras Buena y
Relativamente buena, as como Relativamente mala y Mala, de manera
que obtengamos las categoras Excelente, Buena y Mala. Si nos fijamos en el
histograma de esta variable [Fig.4-42], notaremos que el valor perdido nueve
(9), no aparece; esto se debe a que se defini en las propiedades de variables
este valor como perdido.

Figura 4-29
Para categorizar esta variable, slo necesitamos ingresar los puntos de corte
Cero (Excelente) y 2 (Buena), con lo que obtenemos los resultados de la figura
[4-43]. Si nos fijamos en las etiquetas, notaremos que el primer intervalo slo
cobija los valores Cero equivalentes a la categora Excelente; a su vez, el
segundo intervalo agrupa los valores uno y dos, correspondientes a Bueno y
Relativamente bueno y el tercer intervalo (Superior), agrupa los valores tres y
superiores, lo que nos indica que agrupa las categoras Relativamente
mala y Mala. Para terminar debemos definir las etiquetas correctas para cada
valor [Fig.4-44] y asignarle un nombre a la nueva variable que en este caso
ser Salud.

Figuras 4-43 y 4-44


Despus de definir las propiedades de categorizacin de cada una de las
variables seleccionadas, hacemos clic en Aceptar con lo que parece el
mensaje Las especificaciones de categorizacin generarn 3 variables [Fig.4-
45]. Al hacer clicen Aceptar se cierra el cuadro de dilogo y las nuevas
variables son creadas en el editor de datos de SPSS.

Figura 4-45

Si nos fijamos en la vista de datos del editor [Fig.4-46], notaremos que las
nuevas variables apareen al final del archivo. Cada una de estas variables se
define comoOrdinal [Fig.4-47] y a su vez adquiere los valores perdidos que se
hayan definido para la variable de origen, as mismo las etiquetas de valor
definidas en elprocedimiento, sern anexadas a las variables de resultados;
para comprobarlo, basta con activar el botn Etiquetas en la Vista de datos.

Figuras 4-46 y 4-47

En conclusin el procedimiento Categorizador Visual, nos permite generar


nuevas variables ordinales agrupando los datos de otras variables de Escala u
Ordinales. Estos intervalos pueden ser creados de forma automtica ya sea
mediante intervalos de igual amplitud, intervalos con un porcentaje similar o
mediante la media y las desviaciones tpicas si se prefiere, se pueden definir
los intervalos de acuerdo al criterio del investigador. Es necesario resaltar que
este procedimientorequiere que se le definan los valores mximos de cada
intervalo (Puntos de corte superior) y que a su vez, crea un nmero de
intervalos igual al nmero de puntos ms uno. Las variables que se generen a
travs del procedimiento, conservan los valores perdidos que se hayan definido
para las variables originales.

Recodificar Variables con SPSS


En algunas ocasiones los datos de las variables cuentan con valores muy
dispersos que nos dificultan su interpretacin o sencillamente no se prestan
para el anlisis estadstico. Para subsanar estos inconvenientes, SPSS cuenta
con el procedimiento Recodificar, el cual nos permite transformar los datos de
una o varias variables numricas o de cadena, ya sea reasignando los nmeros
representativos de cada categora o agrupando en rangos los valores de las
variables existentes, segn sean las necesidades del anlisis o el criterio del
investigador.

La principal virtud de este procedimiento, radica en la posibilidad de asignar los


nmeros representativos de cada categora de acuerdo a nuestras
necesidades, lo que nos permite agrupar valores que no son consecutivos;
como por ejemplo, el 1 y el 5. Este procedimiento nos ofrece dos opciones En
las mismas variables y En distintas variables; la principal diferencia de estas
dos posibilidades radica en el destino de los resultados; es decir, el lugar en
donde se guardarn los nuevosvalores asignados.

Dado que SPSS tiene la capacidad de trabajar con un gran nmero de


variables (33.000 aprox), es recomendable utilizar siempre la opcin
correspondiente a En distintas variables, ya que de esta manera podemos
conservar los datos originales. Es necesario resaltar que SPSS permite agrupar
la informacin pero NO permite desagruparla; es decir, podemos utilizar los
procedimientos para convertir una variable de escala a una variable de
categoras (Ordinal), pero no en viceversa.

Para comprender la metodologa utilizada en la recodificacin, vamos a


generar un ejemplo con la variable rea de trabajo (areatrab), la cual
contiene las diferentes reas en la que se desempean cada uno de los
empleados de la empresa Dkf tradicin (1=Operario, 2=Planeacin,
3=Mercadeo, 4=Ventas, 5=Administracin, 6=Ingeniero de proceso y
7=Servicios generales). Para acceder al procedimiento, debemos ir al
men Transformar y seleccionar el submen Recodificar, con lo que aparecen
las dos opciones con que cuenta [Fig.4-48].

Dado que la diferencia en los cuadros de dilogo de estas dos opciones es muy
pequea, elegiremos la opcin correspondiente a En distintas variables. Al
hacer clic en ella, aparece el cuadro de dilogo correspondiente a Recodificar
en distintas variables [Fig.4-49]; este cuadro contiene los elementos habituales
de los cuadros de dilogo, como la lista de variables y la casilla de seleccin,
pero adems incluye tres secciones adicionales denominadas Variable de
resultado, Valores antiguos y nuevos y Condicional.

Figuras 4-48 y 4-49


El primero de estos nuevos componentes corresponde a Variable de resultado;
a travs de esta seccin se definen las propiedades principales de la variable
de resultado, como lo son el Nombre y la Etiqueta. El nombre que se le defina a
la nueva variable debe cumplir con las caractersticas requeridas por el
programa como la longitud (64 caracteres mximo para versin 12.0 y 8
caracteres para las dems versiones), no comenzar con un nmero, etc. (Ver
captulo 1).

La asignacin del nombre es indispensable, ya que el programa no permite


ejecutar la recodificacin hasta que se defina una variable de resultado. En la
opcin etiqueta podemos ingresar una pequea leyenda explicativa que
permita reconocer fcilmente el contenido de la variable; este parmetro no es
obligatorio pero es recomendable para facilitar la interpretacin de
los valores en losresultados.

Para continuar con el ejemplo vamos a recodificar la variable rea de trabajo


(areatrab); lo primero que debemos hacer es seleccionarla en la lista de
variables e ingresarla en la casilla de seleccin haciendo clic en el botn flecha
( ). Una vez ingresada la variable, aparece al costado derecho de ella un
signo de interrogacin (?); este signo se mantendr hasta que se le defina un
nombre a la nueva variable. A continuacin ingresamos en la casilla Variable
de resultado el nombre Recarea y la etiqueta rea de trabajo recodificada. Por
ltimo hacemos clic en el botnCambiar, con lo que el signo de interrogacin
desaparece y en su lugar aparece Recarea [areatrab Recarea].

La segunda nueva seccin del cuadro la compone el botn Valores antiguos y


nuevos; al hacer clic sobre l, aparece un nuevo cuadro de dilogo [Fig.4-50];
en este cuadro se definen los valores que deseamos cambiar y se especifican
a su vez el nuevo valor que le ser asignado.

Figura 4-50

Dentro de este cuadro encontramos cuatro diferentes secciones


(Valores antiguos,Valores nuevos, Casilla de seleccin y las opciones de
recodificacin), cada una de estas secciones define un segmento especfico de
la recodificacin y su aplicacin depende exclusivamente de los criterios del
investigador de acuerdo a las necesidades del anlisis. Los parmetros que se
definan en este cuadro sern aplicados en la nueva variable de resultado.

Cada una de estas secciones sera explorada y explicada en la siguiente


leccin.

Valores Antiguos y Nuevos - Recodificar 2


La primera seccin del cuadro corresponde a Valor antiguo. Dentro de esta
seccin se determinan los valores que se van a recodificar; podemos modificar
valores individuales, rangos de valores y los valores perdidos (ya sea del
sistema o definido por el usuario). Los rangos y los valores perdidos del
sistema no se pueden seleccionar para las variables de cadena, ya que
ninguno de estos conceptos es aplicable a este tipo de variables. Esta seccin
comprende siete diferentes opciones, entre las que encontramos:

Valor: corresponde a un valor antiguo individual que se va a recodificar en


un valor (nmero) nuevo. El tipo de datos del valor introducido (numrico o
de cadena), debe coincidir con el tipo de datos de la variable que desea
recodificar; es decir, no podemos asignar un carcter (letra) como valor
antiguo si nuestra variable original es numrica.

Perdido por el sistema: Son valores asignados por SPSS cuando


los valores de los datos no estn definidos de acuerdo al tipo de formato
que haya especificado (Por ejemplo, letras dentro de una variable
numrica), as como los campos que se encuentren vacios en una variable
numrica (Los valores numricos perdidos del sistema se muestran como
puntos). Para las variables de cadena no se pueden
tener valores perdidos del sistema, ya que el espacio en blanco es tomado
como un carcter. Estos valores son definidos por el programa como
SYSMIS.

Perdido por el usuario: son observaciones que tienen valores que han sido
declarados como perdidos por el usuario. Generalmente
estos valores representan razones por las cuales no se tiene informacin
como por ejemplo No Sabe, No Responde, No Aplica. Estos valores son
definidos por el paquete como MISSING.

Rango: dentro de las opciones de rango encontramos tres posibilidades, la


primera nos permite especificar el limite inferior y superior del rango; la
segunda nos permite asignar los caso desde el menor valor dentro de la
variable hasta un valor definido por el investigador y la tercera nos permite
agrupar los casos desde un valor definido por el investigador hasta el
mayor de los valores. Estas opciones no estn disponibles para variables
de cadena.
Todos los dems valores: al seleccionar esta opcin, se incluirn todos
los valores que no han sido definidos dentro de las especificaciones
anteriores y les asigna el valor deseado en la variable de resultado.
La segunda seccin del cuadro corresponde a Valor Nuevo. En esta seccin se
definen los valores que tomaran los datos en la variable de resultado despus
de la recodificacin. Dentro de las opciones de los
nuevos valores encontramos:

Valor: En esta casilla se introduce un valor numrico individual, el cual


representar a uno o ms de los valores antiguos. Si se desea recodificar
una variable numrica en una variable de cadena, tambin se debe
seleccionar la opcin Las variables de resultados son cadenas, con lo que
el programa define los valores numricos como caracteres (Por ejemplo: el
nmero 5 lo asume como el carcter 5).
Copiar valores antiguos: esta opcin retiene el o los valores antiguos que
no se hayan incluido dentro de de alguno de los nuevos valores. Si
algunos de los datos no requieren la recodificacin, se utiliza esta opcin
para incluirlos. Cabe aclarar que cualquier valor antiguo que no sea
especificado no ser incluido en la nueva variable, y en su lugar aparecen
espacios en blanco.
Perdido por el sistema: esta opcin recodifica el valor antiguo, en un valor
perdido por el sistema. Los valores perdidos por el sistema no son
utilizados en los clculos. Esta opcin no se encuentra disponible para las
variables de cadena ya que el carcter espacio es valido.

La tercera seccin del cuadro corresponde a la Lista de Recodificacin. En esta


seccin se genera un listado con las especificaciones de los valores antiguos y
nuevos. Dentro de la seccin encontramos las opciones Aadir (Agrega un
valor a la lista), Cambiar (Modifica un valor de la lista) y Borrar (Elimina un valor
de la lista). Para agregar un valor es necesario especificar los valores antiguos
y el valor nuevo; despus de lo cual se hace clic en el botn aadir para
ingresarlo a la lista.

Para modificar la recodificacin de un valor es necesario seleccionarlo de


la lista, modificar los datos y hacer clic en el botn Cambiar y los valores se
modifican dentro de la lista. Para eliminar una asignacin, se debe seleccionar
en el listado y sucesivamente hacer clic en borrar con lo que desaparece de
la lista. Antes de terminar la asignacin de variables es indispensable aadir
todas recodificaciones pendientes o de lo contrario se perdern.

La ltima seccin del cuadro la componen las Opciones de recodificacin. En


esta seccin encontramos dos opciones; la primera corresponde a Las
variables de resultados son cadenas, la cual define la nueva variable
recodificada como variable de cadena (alfanumrica); adems nos ofrece una
casilla en la que podemos establecer el ancho de la variable. La segunda
opcin corresponde aConvertir cadena numrica a nmeros, en donde se
convierten los valores de cadena que contienen caracteres de nmeros
(Ejemplo, 5) en valores numricos. A las cadenas que contengan cualquier
carcter que no sean nmeros, as como las que contengan un signo opcional
(+ -) se les asignar el valor perdido por el sistema. Esta opcin slo se
activa cuando la variable de origen es de cadena, de lo contrario no se habilita.
Continuando con el ejemplo vamos a recodificar los valores de la variable rea
de trabajo (areatrab) en slo tres niveles; el primer nivel comprender los casos
que cuenten con los valores 2 y 5 (Planeacin y Administracin). El segundo
nivel comprende los casos con valores 3 y 4 (Mercadeo y Vendedores) y el
tercer nivel comprende los casos con los valores 1, 6 y 7 (Operario, Ingeniero
de proceso y servicios generales).

El objetivo de esta recodificacin es agrupar las diferentes reas en las que se


desempean los empleados de la empresa en slo tres niveles generales
(Administrativa, Comercial y Operativa) [Fig.4-51]. Si nos fijamos en
los valores que componen cada uno de los nuevos niveles, notaremos que
estn dispersos, por lo que sera imposible realizar esta agrupacin con el
procedimiento Categorizador visual.

Figuras 4-48 y 4-49

Para comprender las diferentes secciones de esta ventana, en la siguiente


leccin haremos la recodificacin de las Areas, Administrativa, Comercial y
Operativa.

Definir Valores Antiguos y Nuevos:


Recodificar 3
La recodificacin la realizaremos para cada uno de los niveles, iniciando con el
Administrativo. Lo primero que debemos hacer es activar la casilla Valor en la
seccin Valores antiguos haciendo clic sobre ella; una vez activa ingresamos el
nmero 2 y sucesivamente activamos la Casilla Valor en la seccin Valor
nuevo, en donde ingresamos el nmero 1; para terminar hacemos clic en el
botn Aadir, con lo que aparece en la casilla de listado la frase (21) [Fig.4-
52].

Figura 4-52

Despus de definir el primer valor, debemos definir el segundo por lo que


ingresamos en la casilla valor de la seccin valores antiguos el nmero cinco
ysucesivamente ingresamos en la casilla valor de la seccin valor nuevo el
nmero 1; al hacer clic en el botn Aadir aparece en la casilla de listado la
frase (51) [Fig.4-53]. Si nos fijamos en las expresiones, notaremos que le
pedimos al programa que incluya los valores 2 y 5 en la nueva variable y que a
su vez les asigne el valor 1.

Figura 4-53

Despus de definir el primer nivel, procedemos con el segundo. Para el


segundo nivel activaremos la primera opcin de rango de la
seccin valores antiguos correspondiente a (Desde / Hasta). En la primera
casilla de esta opcin ingresamos el valor 3 y en la segunda casilla el valor
4, sucesivamente ingresamos el nmero 2 en la casilla valor de la
seccin Valor nuevo; para terminar hacemosclic en el botn Aadir con lo que
aparece en la casilla de listado la frase (3 thru 4 2) [Fig.4-54]. Si nos fijamos
en la expresin, notaremos que le hemos pedido al programa que incluya
los valores desde el 3 hasta el 4 en la nueva variable y que a su vez le asigne
el valor 2.

Figura 4-54

Para el tercer y ltimo nivel, debemos activar primero la casilla valor en la


seccinvalores antiguos e ingresar en ella el nmero
1, sucesivamente ingresamos en la casilla valor de la seccin Valor nuevo el
nmero 3; para terminar hacemos clic en el botn Aadir con lo que aparece en
la lista la leyenda (13) [Fig.4-55]. Si nos fijamos en el listado de expresiones,
notaremos que el valor que acabamos de definir aparece antes de la expresin
del segundo nivel, esto se debe a que el programa va organizando las
expresiones de acuerdo si se tratan de valoresespecficos o rangos.
Figura 4-55

Continuando con la recodificacin, slo nos basta finalizar con el tercer nivel de
trabajo, por lo que activamos la primera opcin de rango (Desde / Hasta), e
ingresamos en la primera casilla el nmero 6 y en la segunda casilla el nmero
7;sucesivamente ingresamos en la casilla valor de la seccin Valor nuevo el
nmero 3 y posteriormente hacemos clic en el botn Aadir, con lo que
aparece en ellistado la frase (6 thru 7 3) [Fig.4-56].

Figura 4-56

Si nos fijamos en la expresin del tercer nivel, notaremos que le pedimos al


programa que incluya en la nueva variable los valores 1, 6 y 7 y que a su vez
les asigne a ellos el valor 3. Despus de ingresar todas las expresiones
hacemos clicen Continuar con lo que volvemos al cuadro de dilogo principal
del procedimiento. Si no se han aadido todas las expresiones, aparece en la
pantalla el mensaje Se perdern todas las operaciones pendientes de Aadir o
cambiar.

Condicionar Casos - Recodificar Variables 4


La ltima seccin del procedimiento Recodificar corresponde a
la Condicional. A travs de esta opcin, podemos restringir el nmero de
casos que sern recodificados mediante expresiones de comparacin
(Ecuaciones), las cuales pueden estar sujetas a cualquiera de las variables
del archivo; es decir podemos utilizar una o ms variables del archivo para
crear la restriccin sin importar si estas variables sern recodificadas o no.

Para utilizar una expresin condicional debemos hacer clic en el botn SI... del
cuadro de dilogo principal. Al hacer clic en l, aparece un nuevo cuadro de
dilogo correspondiente a Si los casos [Fig.4-57]; este cuadro nos permite
aplicar transformaciones de los datos para subconjuntos de casos
seleccionados por medio de expresiones condicionales. Una expresin
condicional devuelve un valor verdadero, falso o perdido para cada caso. Si
el resultado de una expresin condicional es verdadero, la transformacin se
aplicar al caso. Si el resultado de una expresin condicional es falso o
perdido, la transformacin no se aplicar al caso.

Figura 4-57

Este cuadro de dilogo esta dividido en las secciones Lista de variables, Zona
de ecuacin (en esta casilla se ingresa la expresin de condicin), Calculadora
de SPSS (ver Depuracin Capitulo III) y las posibilidades de seleccin donde
encontramos la posibilidad de escoger las opciones Todos los casos (Aplica la
transformacin a todos los casos) o la opcin Incluir si el caso satisface la
condicin (Aplica la transformacin slo a los casos que cumplen las
condiciones especificadas en la expresin).

Generalmente la mayora de las expresiones condicionales utilizan al menos


uno de los seis operadores de relacin (<, >, <=, >=, = y ~=) ubicados en el
teclado de calculadora. Las expresiones condicionales pueden incluir nombres
de variable, constantes, operadores aritmticos, funciones numricas, variables
lgicas y operadores relacinales.

Las condicionales se utilizan cuando deseamos seleccionar slo un fragmento


de la informacin; es decir, nuestra atencin esta dedicada exclusivamente a
un grupo especfico de respuestas. Por ejemplo, supongamos que deseamos
saber cuantos de los entrevistados son hombres y se encuentran dentro del
rea administrativa, con el fin de determinar su conducta. Para realizarlo,
debemos definir la restriccin en la ventana de condiciones, por lo que
hacemos clic en la opcin Incluir si el caso satisface la condicin, de manera
que se activen todas las secciones de la ventana.

A continuacin seleccionamos en el listado la variable Gnero y la ingresamos


en la casilla de ecuacin e inmediatamente ingresamos el signo igual (=) por
medio del teclado de la calculadora, as como el nmero dos (2) el cual
representa a las personas del genero Masculino; la expresin debe quedar
(GNERO = 2). Una vez introducida la ecuacin correctamente
hacemos clic en Continuar con lo que volveremos al cuadro de
dilogo Recodificar en distintas variables [Fig.4-58]; si nos fijamos en la parte
inferior del cuadro de dilogo notaremos que aparece la expresin de la
restriccin que se ha definido.

Figuras 4-58 y 4-59

Una vez definidos todos los parmetros del procedimiento, hacemos clic en el
botn Aceptar con lo que se ejecuta la recodificacin y la variable de resultado
aparece en la parte final del editor de datos de SPSS [Fig.4-59].

Esta variable contendr slo los niveles del rea de trabajo de los casos que
pertenezcan al gnero masculino; para los casos pertenecientes al gnero
Femenino se le asignan valores perdidos por el sistema; es decir, aparece un
espacio en blanco (. ). A cada nueva variable generada por la Recodificacin se
le debe definir las propiedades por medio de la pestaa vista de variables o
elprocedimiento Definir propiedades de variables, ya que por defecto el
programa las crea sin propiedades.

Comparacion de Metodos Recodificar de SPSS


Para finalizar con la recodificacin vamos a comparar los cuadros de dilogo de
las dos opciones del procedimiento En las mismas variables [Fig.4-60]
y En distintasvariables [Fig.4-61], con el fin de establecer sus diferencias. Si
nos fijamos en las figuras, podremos apreciar que los dos cuadros de dilogo
cuentan con las secciones Lista de variables, Casilla de seleccin, Opciones de
Recodificacin yOpciones del cuadro de dilogo.
Figura 4-60

Figura 4-61

La nica diferencia que se puede establecer entre las dos opciones radica en la
seccin Variable de resultado que se incluye en el cuadro de dilogo
delprocedimiento En distintas variables. Esta diferencia se debe a que la
segunda opcin (En distintas variables), guarda los cambios realizados en una
nueva variable, mientras que la primera opcin (En las mismas variables)
reemplaza los valores dentro de la variable original.

Cada una de las secciones que tienen en comn estos dos cuadros, funcionan
de forma idntica; es decir, la definicin de los parmetros de la recodificacin
se realiza de la misma forma en los dos procedimientos; con la nica diferencia
que para la primera opcin no es necesario definir el nombre y la etiqueta de la
variable de resultado. Desde luego es recomendable emplear siempre que sea
posible laRecodificacin en distintas variables, ya que es posible que se
necesite trabajar con los valores originales en otro momento del anlisis.

La principal desventaja de la remodificacin radica en que los valores


resultantes no cuentan con etiquetas de valor y es necesario emplear
otro procedimiento para adicionrselos. Por otro lado, la principal ventaja
del procedimiento radica en la posibilidad de unir, reasignar o modificar los
valores de una variable segn sean nuestras necesidades, incluso si los
valores se encuentran dispersos en diferentes rangos.

En resumen, los pasos que se deben realizar para llevar a cabo


una Recodificacinson:

Activar el procedimiento (en el men Transformar seleccionamos


el procedimiento Recodificar y escogemos una de las
dos opciones Mismas variable Diferentes variables).
Seleccionar la variable (en el listado de variables escogemos la (s)
variable (s) de inters y la ingresamos a la casilla de seleccin).
Definir el nombre a la variable destino (slo para la
opcin Distintas variables).
Definir los nuevos valores (hacer clic en el botn Valores nuevos y
antiguos; al abrir el cuadro de dilogo definimos los valores viejos y
nuevos; despus hacemos clic en Continuar).
Definir la expresin de condicin (este paso es opcional; slo se utiliza si
deseamos restringir la Recodificacin a una fraccin de los casos)
Ejecutar la Recodificacin (hacer clic en el botn Aceptar).

En conclusin la Recodificacin de variables nos permite asignar un nmero a


los valores o rangos de la variable original, con la ventaja que es el investigador
quien determina el valor de la nueva variable. Adems esta opcin esta en
capacidad de realizar los procedimiento ejecutados por la Recodificacin
Automtica y Categorizar variable, con la nica limitante que los valores que se
recodifiquen no contarn con las etiquetas de valor y la variable de resultado no
tiene definida ninguna de las propiedades.

Contar Apariciones en los datos de SPSS


En algunas ocasiones nuestras bases de datos cuentan con varias variables
relacionadas a un mismo tema, las cuales contienen informacin
complementaria. SPSS nos permite conocer el nmero de respuestas de
cada uno de los individuos (Casos) a un grupo determinado de variables
(Preguntas), creando una nueva variable que contenga el nmero de
respuestas por individuo.

Este procedimiento genera un valor por cada uno de los casos, el cual
representa el nmero de veces que se encontr el valor especificado dentro
del total de las variables; el mximo valor que puede tomar este parmetro
es igual a la cantidad de variables del conjunto. Por ejemplo si tomamos 5
variables, el valor mximo de apariciones por caso ser el nmero 5 y el
valor mnimo ser el nmero 0.

Para comprender la metodologa y los alcances del procedimiento vamos a


generar un ejemplo con las variables Nivel de satisfaccin con la empresa
(Satemp), Nivel de satisfaccin con el sueldo remunerado (Satsuel), Nivel
de satisfaccin con el entorno de trabajo (Satentor) y Nivel de satisfaccin
con sus compaeros de trabajo (Satcompa), las cuales se incluyen en el
archivo Encuesta.sav y donde el valor uno (1) es el mnimo de satisfaccin y
el valor cinco (5) es el mximo.

El objetivo del ejemplo es determinar cuantas respuestas nos facilitaron


cada uno de los encuestados. Para acceder al procedimiento, debemos
dirigirnos al menTransformar y seleccionar la opcin Contar
apariciones [Fig.4-62]. Al hacer clic en la opcin, aparece el cuadro de
dilogo correspondiente [Fig.4-63]; en este cuadro debemos definir el
nombre y la etiqueta de la variable de destino, el conjunto de variables en la
que se realizar el conteo, el valor o rango de valores que sern tomados
en cuenta y de forma opcional, las restricciones o expresiones de condicin
para los casos explorados.

Figuras 4-62 y 4-63

En este cuadro de dilogo encontramos las secciones habituales de SPSS


como lalista de variables y la casilla de seleccin, pero adems aparecen
las seccionesVariable de destino (En esta casilla se ingresa el nombre y la
etiqueta de la variable de resultado; estos parmetros deben cumplir con
los requisitos del programa), Definir valores (En esta seccin declaramos el
valor o rango de valores que sern tenidos en cuenta en el conteo)
y Condicional.

Continuando con el ejemplo, vamos primero a definir el nombre y la etiqueta


de la variable de resultado, por lo que activamos la casilla Nombre e
ingresamos en ella la frase (Numres); sucesivamente activamos la casilla
Etiqueta e ingresamos la leyenda Nmero de respuestas. Una vez definido
el nombre y la etiqueta, debemos especificarle al programa las variables en
las que se realiza el conteo. Para realizarlo debemos ubicar en la lista de
variables, las variables (Satemp, Satsuel, Satentor y Satcompa) y
sucesivamente seleccionarlas e ingresarlas a la casilla se seleccin
haciendo clic en el botn flecha ( ) ubicado al costado derecho de la lista.

Despus de definir las variables, debemos definir el valor o rango de valores


que ser tenido en cuenta para el conteo. Para activar esta seccin
hacemos clic en el botn Definir valores, con lo que aparece el cuadro de
dilogo correspondiente aContar los valores [Fig.4-64]; en este cuadro
encontramos dos secciones, la primera corresponde a Valor, donde
encontramos 6 diferentes opciones de valor. La segunda seccin
corresponde a la casilla de seleccin, donde aparecen los valores que se
hayan definido para el conteo. Como puede apreciarse en la figura, este
cuadro es muy similar al hallado en la opcin Valores antiguos y
nuevos delprocedimiento Recodificar variables, por lo que no entraremos en
el detalle de cada una de las opciones.

Figura 4-64

Para ingresar los valores debemos seleccionar la opcin que ms se


adecue a nuestras necesidades que en nuestro caso corresponde a Rango
(Desde / Hasta), por lo que activamos la opcin e ingresamos en la primera
casilla el nmero 1 y en la segunda casilla el nmero 5; posteriormente
hacemos clic en el botn Aadir con lo que parece en la casilla de seleccin
la frase (1 thru 5), lo que le indica al programa que cuente todos los valores
que estn dentro de este rango en las variables seleccionadas. Una vez
establecido el valor hacemos clic en el botnContinuar, con lo que volvemos
al cuadro de dilogo principal (Contar apariciones).

Por ltimo podemos ingresar una restriccin a los casos que deseamos
contar, haciendo clic en el botn (Si...); note que este cuadro es similar al
explicado en el apartado anterior. En esta seccin debemos ingresar la
expresin condicional con la que se realiza la seleccin de casos.

Por el momento no ingresaremos ningn tipo de restriccin por lo que


hacemos clic en el botn Continuar. Despus de haber definido todos los
parmetros delprocedimiento (Variable de destino, Conjunto de variables y
Valores), hacemos clic en el botn Aceptar, con lo cual el proceso se
ejecuta y los resultados son representados en la parte final del editor de
datos de SPSS dentro de la variable Nmero de respuestas (numres) [Fig.4-
65]. Al observar los resultados de la variable, notaremos que cada uno de
los encuestados cuenta con un nmero distinto de respuestas.
Figura 4-65

En conclusin el procedimiento Contar apariciones, nos permite conocer el


nmero de veces que un valor o un grupo de valores aparece dentro de un
conjunto de variables definidas por el investigador; la nica desventaja de
este procedimientoradica en que desconocemos las variables en las que se
encuentra dicho valor.
Calcular con SPSS
Una de las principales ventajas de SPSS radica en la posibilidad de crear
nueva informacin a partir de los datos contenidos en las variables originales.
El procedimiento que nos permite realizar esta labor se denomina Calcular y su
funcin es realizar clculos mediante ecuaciones matemticas basadas en
operadores aritmticos, lgicos, exponenciales, etc. Con este procedimiento
podemos calcular valores para variables numricas o variables de cadena
(Alfanumrica), y a su vez guardar los resultados en una nueva variable o
reemplazar los valores de una variable existente. Adems, a travs de este
procedimiento, podemos calcular valores de forma selectiva para subconjuntos
de datos utilizando expresiones condicionales.

Para comprender la metodologa y los alcances del procedimiento Calcular,


vamos a generar un ejemplo con las variables Ventas trimestrales (Ven1tri,
Ven2tri, Ven3tri y Ven4tri) del archivo Ventas.sav, el cual se encuentra en
la carpeta Captulo4 del CD adjunto. Antes de ingresar al procedimiento es
necesario cargar el archivo en el editor de datos de SPSS, por lo que debemos
abrirlo ya sea por medio de la rutaArchivo.. Abrir.. Datos.. mediante el
botn Abrir ( ) ubicado en la barra de herramientas. Una vez abierto el archivo
estamos listos para utilizar el procedimiento.

Para acceder al procedimiento debemos ir al men Transformar y seleccionar


la opcin Calcular [Fig.4-66]; al hacer clic sobre la opcin, aparece el cuadro de
dilogo correspondiente [Fig.4-67]. En este cuadro debemos definir el nombre y
las propiedades (Tipo y Etiqueta) de la variable de destino, as como la
ecuacin matemtica con la que se van ha realizar los clculos. Adems
podemos definir una expresin condicional que nos limite el nmero de casos
calculados.

Figuras 4-66 y 4-67

Este cuadro esta compuesto por las secciones tradicionales del programa
como la lista de variables y la casilla de seleccin (Expresin Matemtica), as
como tambin la calculadora de SPSS (Ver depuracin Captulo III) y la
Condicional. La nica seccin nueva que aparece en este cuadro corresponde
a Variable de destino, en la cual se definen el nombre, la etiqueta y el tipo de
datos de la variable de resultado.

Continuando con el ejemplo, lo primero que debemos hacer es asignar el


nombre a la variable destino, para lo cual nos ubicamos en la casilla Destino y
le ingresamos el nombre Ventotal; una vez se ingresa el nombre se activa el
botn Tipo y etiquetaen el que hacemos clic, con lo que aparece el cuadro de
dilogo correspondiente [Fig.4-68]. En este cuadro encontramos dos secciones,
la primera corresponde a la etiqueta de la variable de destino, en donde
podemos ingresar una pequea leyenda descriptiva o utilizar la expresin como
etiqueta. La segunda seccin corresponde al Tipo de la variable de destino en
donde debemos especificar si la variable de resultado es Numrica o de
Cadena (Alfanumrica); si escogemos el tipo de cadena debemos recordar que
este tipo de variables no son tenidas en cuenta para los clculos de los
procedimientos estadsticos.

Figura 4-68

Continuando, ingresamos en la etiqueta la leyenda (Ventas totales del ao), a


su vez seleccionamos el tipo Numrica y hacemos clic en el
botn Continuar con lo que volvemos al cuadro de dilogo Calcular variable.
Despus de definir la variable de destino debemos ingresar la ecuacin
matemtica en la seccin expresin matemtica (La expresin puede utilizar
nombres de variables existentes, constantes, operadores aritmticos y
funciones [aritmticas, estadsticas, de distribucin de cadena]).

Para ingresar la expresin, debemos ubicar la variable Ventas primer trimestre


(Ven1tri) en la lista de variables e ingresarla en la casilla de ecuacin haciendo
clic en el botn flecha ( ), a continuacin hacemos clic en el botn suma ( )
de la Calculadora de SPSS; enseguida ingresamos la variable Ventas segundo
trimestre (Ven2tri) y nuevamente hacemos clic en el botn suma ( ). Este
procedimiento lo repetimos con las variables Ven3tri y Ven4tri de tal manera
que la expresin quede (Ven1tri + Ven2tri + Ven3tri + Ven4tri) [Fig.4-69].

Figura 4-69

Por ltimo tenemos la opcin de delimitar el nmero de casos que sern


tenidos en cuenta para el clculo mediante el botn (Si...), este botn abre el
cuadro de dilogo de condicin utilizado en los apartados anteriores. Por el
momento no utilizaremos expresiones condicionales, as que despus
de ingresar la ecuacin matemtica correctamente hacemos clic en el
botn Aceptar, con lo que losresultados sern representados en el editor de
datos de SPSS [Fig.4-70], generando una nueva variable llamada Ventotal al
final del archivo.

Figura 4-70
Debemos tener en cuenta que el procedimiento calcular no se puede realizar
cuando contamos con valores perdidos por el sistema ( . ) dentro de las
variables, ya que cualquier operacin aritmtica que se realice con un valor
perdido da como resultado un valor perdido; es decir, cualquier clculo (suma,
resta, divisin, multiplicacin, etc) realizado entre un valor numrico y un valor
perdido por el sistema, da como resultado un valor perdido por el sistema; es
por este motivo que en las variables (Ven1tri, Ven2tri, Ven3tri y Ven4tri),
encontramos valores cero (0) en vez de valores perdidos por el sistema.

En conclusin el procedimiento Calcular nos permite generar nuevas variables


o reemplazar las existentes con valores hallados por medio de ecuaciones
matemticas cuya complejidad depende del criterio del investigador o las
necesidades del anlisis. Para estas expresiones se pueden emplear variables,
operadores (aritmticos, lgicos, exponenciales, etc.), as como tambin
funciones (aritmticas, estadsticas, de distribucin de cadena). Es necesario
resaltar que siempre que se utilice este procedimiento se debe recordar que las
operaciones realizadas con valores perdidos darn como resultado valores
perdidos.

Calcular un nivel general - Ejemplo aplicativo


Una de las aplicaciones ms complejas que podemos encontrar en la
manipulacin de los datos emerge cuando deseamos generar una variable que
represente el nivel general de confianza en un grupo de diferentes entidades,
instituciones oproductos. Su dificultad radica en la cantidad de procesos que
debemos realizar para llevar a cabo la creacin de la nueva variable. Para
comprender los pasos que se deben ejecutar para llevar a cabo la creacin de
un nivel general, vamos a generar un ejemplo con las variables del
archivo Satisfaccin.sav, el cual se incluye en la carpeta Captulo4 del CD
adjunto. Antes de iniciar la creacin del nivel general, es necesario contar con
la informacin en el editor de datos de SPSS, por lo que debemos abrir el
archivo ya sea mediante la ruta Archivo..Abrir..Datos por medio del
botn Abrir ( ) ubicado en la barra de herramientas del editor de datos.

Dentro del archivo Satisfaccin se han incluido las variables (Satemp, Satsuel,
Satentor, Satcompa, Sattraba, Satjefe y Satbene); las cuales contienen nivel de
confianza o satisfaccin de los empleados de la empresa Dkf Tradiccin. Esta
informacin representa las respuestas de cada uno de los encuestados a
lapregunta Qu grado de satisfaccin le merecen los siguientes parmetros
de la compaia?, la Empresa, el Salario remunerado, su Entorno de trabajo,
sus Compaeros de trabajo, Su trabajo, Su jefe y los beneficios de la empresa
(Salud, pensin, cesantas, etc). En donde el valor uno (1) representa la
mnima satisfaccin y el valor diez (10) la mxima.

Debemos recordar que nuestra intencin es generar el nivel de satisfaccin


total de los encuestados respecto a su trabajo para la compaa y no detectar
el nmero de estamentos en los que confan o el parmetro en el que ms se
confa. Para poder hallar el nivel general de satisfaccin lo primero que
debemos hacer es generar una ecuacin que nos permita obtener un valor
numrico representativo. Por lgica la primera opcin que tenemos es:
Esta ecuacin nos permite hallar el nivel de confianza como el resultado de la
suma de cada uno de los valores de las variables dividido en el nmero total de
variables. Esta ecuacin primaria presenta algunos inconvenientes ya que no
se tiene en cuenta dos factores que influyen de forma directa sobre el
resultado, como los son los valores perdidos (ya sean definidos por el usuario o
por el sistema) y el nmero de respuestas validas de cada encuestado.

Supongamos que se le asigno el valor 99 a los valores perdidos por el usuario,


los cuales representan las razones No sabe o No responde (Ns/Nr); si dentro
de las respuestas de un encuestado encontramos los valores (8, 10, 10, 9, 7, 6
y 99), al emplear la ecuacin inicial obtendramos un nivel de confianza igual a
(149/7) (21.3 aprox). Como podemos notar este valor se localiza fuera del
rango til establecido (de 1 a 10) y se debe a que el programa emplea todos los
valores que se encuentren dentro de las variables definidas para realizar los
clculos, incluyendo los valores perdidos definidos por el usuario (Missing).

La otra posibilidad que se presenta en los clculos con los valores perdidos es
ocasionada por los valores perdidos por el sistema, en cuyo caso las
operaciones (aritmticas, lgicas, exponenciales, etc), generan como resultado
otro valor perdido por el sistema el cual se representa con un punto ( . ). Es
decir, si dentro de las respuestas de un encuestado encontramos los valores
(8, 10, 10, 9, 7, 6 y . ); al emplear la ecuacin inicial obtendremos como
resultado un valor perdido por el sistema ( . ).

Como podemos apreciar los valores perdidos pueden ocasionar serios


problemas en el momento de generar el nivel de confianza, por lo que es
indispensable asignarle a estos valores un nuevo valor numrico que no afecte
los resultados de los clculos; esta facultad no la proporciona la utilizacin del
nmero cero (0), ya que este valor no influye en el resultado de la operacin
suma, por lo que es considerado su mdulo.

Para modificar los valores perdidos de las variables de inters debemos ir al


menTransformar, escogemos el procedimiento Recodificar y seleccionamos la
opcinEn distintas variables, con lo que aparece el cuadro de dilogo
correspondiente [Fig.4-71]. Debemos seleccionar la opcin En distintas
variables, ya que el objetivo de este procedimiento es asignarle a los valores
perdidos (por el usuario o por el sistema) el valor numrico cero (0) y una vez
que lo hemos realizado no se puede revertir; es decir, si despus de generar el
nivel de confianza total queremos dejar la informacin recodificada en su
estado original no lo podramos hacer ya que hemos reunido los dos tipos
de valores perdidos en una sola categora y SPSS no posee un procedimiento
que nos permita invertirlo.

Debemos recordar que los valores perdidos definidos por el usuario son
razones por las cuales no se obtuvo una respuesta coherente con el rango de
posibilidades validas, como No sabe, No responde No aplica; mientras que
los valores perdidos por el sistema son la ausencia total de un valor y pueden
ser ocasionados por errores de digitacin o de captura, por lo que es
recomendable revisarlos en el momento de realizar la depuracin de los datos
(ver Capitulo III).

Figura 4-71

Una vez aparece el cuadro de dilogo de Recodificar en distintas variables,


debemos ingresar cada una de las variables de inters en la casilla de
seleccin y definirles un nuevo nombre. Para continuar con el ejemplo
precisaremos los nombres (satemp S1, satsuel S2, satentor S3,
satcompa S4, sattraba S5, satjefe S6 y satbene S7), con lo cual
se facilita el reconocimiento de las variables de resultado. Despus de asignar
los nombres a cada una de las variables, hacemos clic en el botn Valores
nuevos y antiguos, con lo que aparece el cuadro de dilogo correspondiente.

Calcular un nivel general - Ejemplo aplicativo


2
Si los valores perdidos por el usuario han sido declarados correctamente dentro
de las propiedades de las variables (Ver Capitulo I), podemos seleccionar
opcin Perdido por el sistema o por el usuario dentro de la seccin
de valores antiguos, ya que el programa los reconocer automticamente. Si
por el contrario no se han declarado los valores perdidos por el usuario dentro
de las propiedades de las variables (Pestaa Vista de variables), es necesario
recodificar cada uno de losvalores, utilizando la casilla de valor para su
definicin y el botn aadir para suingreso.

Continuando con el ejemplo, vamos a la seccin Valores antiguos y


seleccionamos la opcin Perdido por el sistema o el usuario, luego en la
seccin Valor nuevoingresamos el nmero cero (0) dentro de la casilla
de Valor y hacemos clic en el botn Aadir; posteriormente seleccionamos la
opcin Todos los dems valoresen la seccin de valores antiguos y en la
seccin Valores nuevos la opcin Copiarvalores antiguos y nuevamente
hacemos clic en Aadir. Fig [4-72].
Figura 4-72

Una vez se han ingresado en la lista de seleccin el nuevo valor y la copia de


los dems valores, hacemos clic en el botn Continuar, con lo que volvemos al
cuadro de dilogo Recodificar en diferentes variables; para finalizar
hacemos clic en el botn Aceptar con lo que se realiza la recodificacion y las
nuevas variables aparecen en la parte final del editor de datos de SPSS [Fig.4-
73]. Debemos notar que los nicos valores que han cambiado corresponden a
los valores perdidos, mientras los dems valores quedan intactos.

Figura 4-73

Despus de solucionar el inconveniente de los valores perdidos, debemos


concentrar nuestra atencin en el segundo problema de la ecuacin inicial, el
cual es producido por el nmero de respuesta de cada uno de los encuestados.
Supongamos que dentro de las respuestas de dos encuestados encontramos
losvalores (9, 8, 7, 6, 5, 7 y 8) y (10, 10, 10, 9, 10, 0 y 0); al emplear la ecuacin
inicial obtendramos los niveles de satisfaccin (7) y (7) respectivamente.

Aparentemente estos dos encuestados tienen el mismo nivel de satisfaccin en


la compaa, pero debemos notar que el primer resultado se basa en un nivel
relativamente bajo de satisfaccin en el total de los parmetros de la empresa,
mientras que el segundo resultado es ocasionado por la falta de respuesta en
dos (2) de los parmetros. Para solucionar este inconveniente debemos crear
una nueva variable que contenga el nmero de respuestas de cada uno de los
encuestados.

Para crear una nueva variable que contenga el nmero de respuestas validas
de cada uno de los encuestados, debemos ir al men Transformar y
seleccionar el procedimiento Contar apariciones, con lo que aparece el cuadro
de dilogo correspondiente [Fig.4-74]. En este cuadro definimos el nombre de
la variable de resultado y la etiqueta, que para el caso sern resval y Nmero
de respuestas validas respectivamente.

Una vez definida la variable de resultado, debemos ingresar en la casilla de


seleccin cada una de las variables en las que se realizar el conteo; por lo
que en la lista de variables ubicamos cada una de las variables que acabamos
de crear (S1, S2, S3, S4, S5, S6 y S7) y las vamos ingresando a la casilla con
el botn flecha ( ).

Figura 4-74

Despus de ingresar las variables en la casilla de seleccin, debemos


especificar los valores que sern contados, para lo que hacemos clic en el
botn Definirvalores de manera que aparezca el cuadro de dilogo
correspondiente [Fig.4-75]. Dado que los valores validos se encuentran dentro
del rango comprendido entre 1 y 10, seleccionamos la primera opcin
de Rango en la seccin de valorescorrespondiente a (Desde / Hasta).
Figura 4-75

En la primera casilla ingresamos el valor uno (1) y en la segunda el valor diez


(10); seguidamente hacemos clic en el botn Aadir, apareciendo en la casilla
de seleccin la frase (1 Thru 10). Una vez definido el rango
de conteo hacemos clic en el botn Continuar, volviendo al cuadro de
dilogo Contar apariciones. Para finalizar hacemos clic en el botn Aceptar,
con lo que se realizar el conteo y los resultados son representados en la
variable resval en el editor de datos de SPSS.

Hasta este momento slo hemos corregido los problemas que presentaba la
ecuacin inicial, los cuales pueden ocasionar serios inconvenientes en el nivel
general de satisfaccin. Una vez corregidos estos factores la ecuacin queda:

En la siguiente leccion emplearemos esta ecuacion para realizar el calculo del


nivel general de satisfaccin.
Trabajar anlisis descriptivos con Powers de estadsitica y volver a esta pgina

Generando anlisis descriptivos con SPSS

procedimientos estadsticos para el anlisis descriptivo de la informacin,


algunos de los cuales, son de mayor utilidad de acuerdo al nivel de medida
de cada variable (Categrica Escala). Para conocer estos procedimientos
vamos a utilizar el archivo Anlisis.sav incluido en la carpetaCaptulo5 del
CD adjunto

Todos los procedimientos estadsticos con que cuenta SPSS se encuentran ubicados en el
men Analizar. Al hacer clic en l aparece una lista desplegable [Fig. 5-4], en la cual se pueden
observar los diferentes procedimientos con que cuenta el programa, como Informes,
Estadsticos descriptivos, Tablas, Comparar medias, Modelo lineal general, Modelos mixtos,
Correlacin, Regresin, Loglineal, Clasificar, Reduccin de datos, Escalas, Pruebas no
paramtricas, Series temporales, Supervivencia, Respuestas mltiples, Anlisis de valores
perdidos y Muestras complejas

A continuacin haremos un recorrido por los procedimientos principales del


submen Estadsticos descriptivos, tratando de explorar la mayora de sus
componentes.

1. FRECUENCIAS
Este procedimiento nos permite analizar de forma descriptiva las variables
Categricas o de Escala, mediante la generacin de tablas de frecuencia,
Grficos y una amplia gama de estadsticos como las medidas de tendencia
central, de Dispersin y de Distribucin. Adems nos permite organizar los
resultados de forma ascendente o descendente ya sea por sus valores o
sus frecuencias.

Para emplear este procedimiento es necesario ir al men Analizar,


seleccionar el submen Estadsticos descriptivos y escoger dentro de l la
opcin Frecuencias, con lo que aparecer el cuadro de dilogo
correspondiente [Fig. 5-5]. Este cuadro de dilogo se divide en cuatro
secciones correspondientes a la lista de variables, la casilla de seleccin,
las opciones de anlisis y mostrar tablas de frecuencias. Como podemos
apreciar las dos primeras secciones son comunes para la mayora de los
cuadros de dilogo de SPSS por lo que no haremos una explicacin de
ellos, en cambio nos enfocaremos en las dos secciones restantes.

Figura 5-5

Dentro de las opciones de anlisis encontraremos todos los estadsticos, los


grficos y las posibilidades de orden con que cuenta
el procedimiento Frecuencias.Para escoger alguna de las opciones basta
con hacer clic sobre ella, con lo que aparecer el cuadro de dilogo
correspondiente a la opcin seleccionada.

En la siguiente leccin veremos detalladamente cada una de las partes


delprocedimiento Frecuencias.

Opciones del Procedimiento FRECUENCIAS


Para activar alguna de las opciones basta con hacer clic sobre ella, con lo que aparecer el
cuadro de dilogo correspondiente a la opcin seleccionada. Por el momento escogeremos la
opcin Estadsticos, por lo que hacemos clic en el botnEstadsticos de manera que aparezca
el cuadro de dilogo correspondiente aFrecuencia: Estadsticos [Fig.5-6].
Figura 5-6

En este cuadro encontramos las diferentes medidas estadsticas delprocedimiento, como las
medidas de tendencia central (Media, Mediana, Moda y Suma), medidas de posicin no central
(Cuartiles, puntos de corte y percentiles), medidas de dispersin (Desviacin estndar,
Varianza, Amplitud o rango, Mnimo, Mximo y el Error tpico de la media) y medidas de
distribucin (Asimetra y Curtosis). Adems encontramos una casilla en la cual podemos
informarle al programa que los valores representan puntos medios de grupos; es decir, que los
valores de la variable representan el punto medio de los datos agrupados.

Dado que la mayora de los estadsticos que comprende este cuadro de dilogo han sido
explicados en los apartados anteriores, slo haremos referencia a lasmedidas de posicin no
central. Estas medidas nos permiten conocer el valor que se encuentra o representa una
posicin especfica dentro de los datos. Supongamos que contamos con 100 datos, cuyos
valores varan entre 1 y 100; si le pedimos al paquete que nos indique el valor de los cuartiles,
el programa nos ensear los valores que se encuentren en las posiciones equivalentes al
25%, 50% y 75% de los datos, que para el caso seran los valores (25, 50 y 75)
respectivamente.

Por el contrario, los Percentiles nos permiten conocer los valores que se encuentran en un
porcentaje especfico de los datos; es decir, nos permite saber que valor se encuentra en la
posicin que nosotros deseemos conocer, sin importar si se trata de un porcentaje entero o
fraccional (Ej:18.75, 19.25, 20, etc). Desde luego estas posiciones no deben superar la cifra de
cien, ya que para su clculo se toma la totalidad de los datos validos como el global del
porcentaje; es decir, el 100%.

Por ltimo, encontramos la opcin Puntos de corte para [XX] grupos iguales, en donde
podemos pedirle al paquete que divida la informacin en un determinado nmero de grupos
con igual porcentaje de casos. Esta opcin nos ofrece como resultado los percentiles de corte
(Porcentajes) de cada uno de los grupos y nos indica a su vez el valor que se encuentra en
cada punto. La nica restriccin que presenta esta opcin, corresponde a que el nmero
mximo de grupos que podemos obtener es de 100.

En conclusin las medidas de posicin no central nos permiten identificar los valores que se
encuentran en las posiciones o porcentajes que deseemos conocer, siendo las ms empleadas
los Cuartiles (25%, 50% y 75%).

La ltima eleccin que nos ofrece este nuevo cuadro corresponde a Los valores son puntos
medios de grupos, con la cual le podemos especificarle al paquete que los datos recolectados
en la variable han sido previamente agrupados y sus valores representan el punto medio de
cada uno de los rangos agrupados. Debemos recordar que las ecuaciones de cada una de las
medidas estadsticas difieren s los valores son agrupados con anterioridad.
Para emplear cualquiera de los estadsticos del procedimiento Frecuencias, slo basta con
activarlo haciendo clic sobre la casilla que se encuentra a la izquierda de cada medida, de
manera que aparezca en ella un visto bueno ( ). Podemos seleccionar todos los estadsticos
que deseemos, teniendo como nica limitante el nivel de medida de cada variable. Por el
momento, continuaremos con el recorrido de los diferentes elementos del procedimiento, por lo
que no seleccionaremos ninguno de los estadsticos y en cambio hacemos clic en el
botn Cancelar, con lo que volvemos al cuadro de dilogo Frecuencias.

La segunda opcin del procedimiento frecuencias corresponde a Grficos. Al hacer clic sobre el
botn grficos, aparece el cuadro de dilogo correspondiente aFrecuencias: Grficos [Fig.5-7].
En este cuadro encontramos los tres diferentes tipos de grficos con que cuenta
el procedimiento, como los son el grfico de barras, el grfico de sectores y el histograma.
Adems, a travs de este cuadro podemos escoger si las porciones de los grficos representan
un recuento de los casos (Frecuencias) el porcentaje al que equivale.

Figuras 5-7 y 5-8

Por defecto el programa tiene activada la opcin Ninguno. La seccin valores delgrfico slo se
activa cuando se selecciona uno de los grficos de barras o de sectores y a su vez la casilla
de curva normal slo se activa cuando se selecciona el Histograma [Fig.5-8]. Para comprender,
la esencia de cada uno de estos mtodos de representacin grfica, en la siguiente leccin
vamos a realizar una pequea explicacin de sus elementos y usos.

Grficos del Procedimiento Frecuencias -


SPSS

1. Grfico de Barras
Este tipo de grfico nos permite identificar y comparar de forma visual
elcomportamiento de las categoras de una variable. Por medio de las
barras podemos conocer aspectos de forma sencilla de una o varias
variables, como lo pueden ser sus categoras, las frecuencias y las
diferencias entre ellas. Laestructura bsica de un grfico de barras [Fig.5-9],
esta basado en un eje de categoras generalmente el eje horizontal y un eje
de frecuencias que en algunos casos puede ser remplazado por el
porcentaje. Adems se suelen utilizar diferentes colores para cada una de
las categoras facilitando el reconocimiento por parte delusuario.
Figura 5-9

Los grficos de barras tambin son tiles para comparar varias variables a la vez [Fig.5-10].
Este tipo de opciones implica una serie de tcnicas como la anidacin y la agrupacin las
cuales sern expuestas en el captulo siete.

Figura 5-10

2. Grfico de Sectores
Los grficos de sectores o de torta nos permiten observar la variable de forma global haciendo
una comparacin inmediata del porcentaje o la frecuencia del total de las categoras de una
variable. Su utilidad radica en la facilidad para interpretar la informacin contenida en una
variable mediante la representacin grafica de los resmenes (Porcentajes o Frecuencias).

Figura 5-11

La estructura bsica de los grficos de sectores [Fig.5-11], esta definida por un crculo en el
cual se representan cada una de las categoras por la porcin o fraccin correspondiente al
porcentaje o la frecuencia. En algunas ocasiones suelen separarse las fracciones, con el fin de
hacer ms clara la informacin.
3. Histograma
Los histogramas nos permiten identificar diversos parmetros como la dispersin, la
distribucin y la concentracin de los datos en una variable de Escala. Este tipo de grficos
generan una representacin visual del comportamiento de los datos,
permitiendo observar rasgos caractersticos como la zona o rango de mayor concentracin, la
amplitud, los valores extremos, etc.

La estructura bsica de un histograma [Fig.5-12], esta basada en rangos, los cuales suelen ser
representados por barras cuya altura es determinada por la cantidad de valores que se
encuentren dentro de los lmites de cada rango (Frecuencia). Generalmente se utiliza el Eje
vertical para representar las frecuencias y el Eje horizontal para los rangos; adicionalmente se
puedesobreponer una Curva Normal con el fin de comparar si los datos tienden a distribuirse
de forma uniforme.

Figura 5-12

En resumen cuando se trabaja con variables categricas (Nominal u Ordinal), los grficos ms
indicados y representativos en su anlisis descriptivo corresponden a los grficos de Barras y
los de Sectores; por el contrario si se trata de una variable de Escala el grfico ms apropiado
es el Histograma.

Dado que por el momento slo estamos haciendo un recorrido por las opciones del
procedimiento Frecuencias, no seleccionaremos ninguno de los grficos y en cambio hacemos
clic en el botn Cancelar, con lo cual volvemos al cuadro de dilogo principal del
procedimiento. En la siguiente leccion conoceremos la ultimaopcion del procedimiento
Frecuencias denominada Formato.

Formato del Procedimiento Frecuencias SPSS


La ltima opcin que encontramos en la ventana del Procedimiento Frecuencias
deSPSS corresponde a Formato; al hacer clic sobre el botn aparece el cuadro de dilogo
correspondiente a Frecuencias: Formato [Fig.5-13]. En este cuadro encontramos las
secciones Ordenar por, Mltiples variables y Suprimir tablas.
A travs de la seccin Ordenar por, podemos organizar los resultados
delprocedimiento (Tablas y Grficos) por los valores por las frecuencias,
ya sea de forma ascendente o descendente. Cuando seleccionamos la
opcin Valores, los resultados se organizaran de acuerdo al nmero que se
le haya asignado a cada categora dentro de las propiedades de variable; si
por el contrario escogemos la opcin frecuencias los resultados se
ordenaran de acuerdo al nmero de apariciones de cada una de las
categoras de las variables seleccionadas.

La segunda seccin del cuadro corresponde a Mltiples variables; en donde


encontramos las opciones Compara variables y Organizar resultados segn
variables. Si seleccionamos la primera opcin, los resultados se agruparn
de acuerdo con las variables; es decir, primero nos ensearan las tablas de
frecuencia de todas las variables (Una tabla por cada variable), despus
organiza los estadsticos de cada variable y por ltimo nos ensea los
grficos.

En resumen esta opcin nos permite agrupar los resultados de todas las
variables por cada uno de los procedimientos (Frecuencias, Estadsticos y
Grficos). Si por el contrario seleccionamos la opcin Organizar resultados
segn variables, el programa nos ensea todos los resultados de cada
variable antes de mostrar los resultados de la siguiente; es decir, nos
ensea la tabla de frecuencias, los estadsticos y el grfico de la primera
variable, a continuacin nos ensea los resultados de la segunda y as
sucesivamente hasta terminar con cada una de las variables seleccionadas.

La ltima seccin que encontramos en el cuadro, pertenece a la


opcin Suprimirtablas con ms de n categoras, con la cual podemos pedirle
al paquete que no realice las tablas de frecuencia a las variables qu
cuenten con cierto nmero de categoras, dndonos la oportunidad de
especificar el limite de categoras que deseamos introduciendo el valor en la
casilla Nmero mximo de categoras. Paracontinuar con el recorrido no
seleccionaremos ninguna de las opciones y en su lugar hacemos clic en el
botn Cancelar con lo que volveremos al cuadro de dilogo principal
del procedimiento Frecuencias.

Por ltimo, aparece la seccin corresponde a la opcin Mostrar tablas de


frecuencias [Fig.5-14], la cual nos permite escoger si deseamos que
las tablas de frecuencia se incluyan en los resultados o por el contrario sean
omitidas. Esta opcin se desactiva cuando queremos realizar anlisis
descriptivos a las variables de escala, ya que por lo general sus tablas de
frecuencia suelen contener un gran nmero de valores hacindolas
extensas y poco tiles.
Figura 5-14

Desde luego es apenas logico que una tabla que nos informa que dentro de
los encuestados aparecen 20 con 18 aos de edad, 32 con 19 aos de edad
y as sucesivamente hasta llegar al valor mximo, no es de gran utilidad.
Para facilitar la interpretacin de este tipo de informacin es mejor crear
una nueva variable y codificar estas edades dentro de rangos y
sucesivamente realizar la tabla de frecuencias a esta nueva variable de
edad categorizada.

Para comprender todos los conceptos y elementos que componen


el procedimientofrecuencias, en las siguientes lecciones vamos a realizar a
manera de ejemplo el anlisis de las variables categricas estado civil
(estciv variable Nominal) y Nivel de educacin (niveduc variable Ordinal) y
posteriormente realizaremos el anlisis de las variables de escala Edad del
encuestado (Edad) y Aos de educacin (educ).

Frecuencias Para Variables Categoricas


Dado que el procedimiento frecuencias genera los mismos resultados (Estadsticos, Tablas y
Grficos), para la totalidad de las variables seleccionadas, sin importar s son Categricas o
de Escala y que a su vez, estos dos tipos de medida emplean parmetros distintos en el
anlisis descriptivo; es indispensablerealizar los anlisis de las variables categricas antes que
el de las variables deescala, con el fin de optimizar los resultados, seleccionando
exclusivamente los elementos ms apropiados para cada tipo de medida.

Una vez seleccionado el procedimiento Frecuencias y estando activo el cuadro de dilogo


principal, podemos empezar con el anlisis descriptivo. Lo primero que debemos realizar es
seleccionar las variables de inters (para el caso ESTCIV yNIVEDUC), por lo que nos dirigimos
al listado de variables, las ubicamos y sucesivamente las llevamos hasta la casilla de seleccin
[Fig.5-15], ya sea haciendo doble clic sobre ellas o a travs del botn flecha ( ). Despus de
haber seleccionado las variables debemos especificarle al programa los procedimientos que
deseamos realizar en el anlisis para lo que hacemos clic en el botnEstadsticos... de manera
que aparezca el cuadro de dilogo correspondiente [Fig.5-16], en donde seleccionamos las
medidas Mediana y Moda.
Figuras 5-15 y 5-16

Despus de seleccionar las medidas estadsticas hacemos clic en el botnContinuar con lo que
volvemos al cuadro principal del procedimiento Frecuencias. Para continuar seleccionamos el
botn Grficos con lo que aparece el cuadro de dilogo respectivo [Fig.5-17]; a travs de este
cuadro seleccionaremos la opcin Grafico de barras, teniendo en cuenta definir en la seccin
valores del grfico la opcin frecuencias y posteriormente hacemos clic en el botn Continuar,
con lo que volvemos al cuadro de dilogo principal.

Figura 5-17

Por ltimo activamos el botn Formato con lo que aparece el cuadro de dialogo
correspondiente [Fig.5-18], en donde seleccionamos las opciones Valores
ascendentes y Comparar variables. Una vez activadas estas opciones, hacemos clic en el
botn Continuar con lo que volvemos al cuadro de dilogo principal
delprocedimiento Frecuencias.

Figura 5-18

Hasta este momento todo lo que hemos hecho es pedirle al programa que nos realice
las tablas de frecuencia de las variables ESTCIV y NIVEDUC, as como las medidas de
tendencia central Mediana y Moda, un grfico de barras para cada una de ellas y que organice
los resultados de acuerdo a los valores que se establecieron en las propiedades de las
variables, asi como que exponga los resultados de forma comparativa; es decir, nos ensee
las tablas de frecuencia de las dos variables y sucesivamente los grficos. Para finalizar y
observar los resultados debemos hacer clic en el botn Aceptar con lo que los efectos
delprocedimiento aparecen en el visor de resultados [Fig.5-19].
Figura 5-19

En la siguiente leccion detallaremos los resultados que


genera SPSS alprocedimiento Frecuencias con variables Categoricas.

Resultados - Frecuencias variables


categricas
Por defecto SPSS nos ensea el nombre del procedimiento (en este caso
Frecuencias) y los resultados del mismo, en donde encontraremos
las tablas de estadsticos, las tablas de frecuencia y por ltimo los grficos.
Dentro de las tablasde estadsticos [Fig.5-20] se incluye un resumen de los
valores validos que se encontraron dentro de los datos de cada una de las
variables (ESTCIV y NIEVEDUC), as como los valores de cada uno de los
estadsticos que se le hayan solicitado al procedimiento, que para el caso
corresponden a la Mediana y laModa.

Figura 5-20

Despus de la tabla de estadsticos e informacin, aparecen


las tablas defrecuencia [Fig.5-21]. Por defecto SPSS incluye dentro de
los resultados de unatabla de frecuencia cada una de las categoras de la
variable con sus respectivos estimadores
como Frecuencias, Porcentajes, Porcentajes validos (el porcentaje valido
representa el resultado de dividir la frecuencia de la categora sobre el
nmero total de valores validos) y el Porcentaje acumulado (es
el resultado de la suma del porcentaje valido de las diferentes categoras de
la variable).

Figura 5-21

Si nos fijamos en la tabla de frecuencias correspondiente a la variable Nivel


de educacin (Niveduc), notaremos que aparece una ligera diferencia entre
los valores del Porcentaje y el Porcentaje valido, esta variacin se
ocasionada debido a que dentro de los datos de la variable se encuentran
cuatro (4) valores que han sido declarados como perdidos en las
propiedades de la variable. En este ocasin los valores identifican a los
casos en los que no fue posible obtener una respuesta coherente por parte
de los entrevistados (NR).

La diferencia en los valores se presenta debido a que el porcentaje es


calculado mediante la divisin de la frecuencia sobre el nmero total de
casos (para el ejemplo n= 300), mientras que el porcentaje valido se calcula
a travs de la divisin de la frecuencia sobre el nmero total de casos
validos (para el ejemplo n= 296). Por ejemplo, si calculamos el porcentaje y
el porcentaje valido para la categoraPrimaria obtenemos:

Ahora, si observamos en la parte inferior de la tabla de frecuencias de la


variableNiveduc, notaremos la existencia de dos totales; el primero de ellos
(enmarcado en azul) corresponde a los valores validos, mientras que el
segundo (enmarcado en caf) pertenece al colectivo de los valores
encontrados dentro de la variable. La utilidad de los totales radica en la
informacin que nos brinda acerca del nmero de casos de la variable y el
nmero de casos con respuestas validas.

Por ltimo, aparecen en el visor de resultados los grficos de cada una de


las variables [Fig.5-22]. Por defecto SPSS genera los grficos de cada una
de las variables ubicando en el eje Vertical (eje Y) el recuento o frecuencia y
ubicando en el eje Horizontal (eje X) las categoras; as como el nombre de
la variable a la que corresponde el grfico. Si nos fijamos en los grficos,
notaremos que las categoras ms sobre salientes
son Soltero y Secundaria respectivamente.

Figura 5-22

SPSS nos permite modificar algunos de los parmetros de cada uno de los
grficos como lo puede ser la forma de las barras, el color, la trama de
relleno, la organizacin, etc. Por el momento no profundizaremos en estos
temas ya que sern explorados con mayor profundidad en l captulo 7.

En conclusin el procedimiento Frecuencias al ser utilizado en el anlisis de


variables categricas (Nominal u Ordinal), nos permite identificar los
parmetros ms representativos como lo son el numero de categoras, las
frecuencias de cada categora y la representacin grfica de los datos, la
cual puede ser expresada ya sea mediante un grfico de barras o de
sectores.

Adems es necesario aclarar que los procedimientos que se especifiquen,


se realizarn con todas las variables que se hallan seleccionado, sin
importar el tipo al que corresponda, por lo que es recomendable realizar
primero los anlisis a las variables categricas y posteriormente a las
de escala. En la siguiente leccion haremos un ejemplo
del procedimiento Frecuencias con Variables de Escala.

Frecuencias para variables de Escala


Al contrario del anlisis descriptivo de las variables categricas, cuando
trabajamos con variables de escala las tablas de frecuencia o recuento no
son informacin prctica debido a la gran cantidad de valores o rangos que
se pueden encontrar en las variables de este tipo. Para comprender
el procedimiento que se debe realizar con las variables de Escala, vamos a
realizar el anlisis descriptivo de las variables Edad del encuestado (Edad) y
Aos estudiados (Educao).

i aun te encuentras en el visor de resultados, puedes volver al cuadro de dialogo de


Frecuencias haciendo clic en el botn Recuperar cuadro de dilogo y seleccionando
el procedimiento frecuencias como se muestra en la figura [5-23]. De lo contrarios es necesario
volver al men Analizar.. Estadsticos descriptivos.. Frecuencias.

Figura 5-23

Una vez que hemos abierto nuevamente el cuadro de dilogo del procedimientoFrecuencias,
hacemos clic en el botn Restablecer con lo que todas las opciones seleccionadas
anteriormente se desactivarn. Al igual que con las variables categricas, lo primero que
debemos efectuar es definir las variables a las que le realizaremos el anlisis, que en nuestro
caso son Edad y Educaos, por lo que debemos ubicarlas en la lista de variables y llevarlas a
la casilla de seleccin, ya sea haciendo doble clic sobre ellas o a travs del botn flecha ( );
posteriormente debemos desactivar la opcin Mostrar tablas de frecuencias, con lo que
aparecer el mensaje [Fig.5-24]. Ha desactivado todos los resultados. A menos que solicite
Mostrar tablas de frecuencias, Estadsticos o Grficos, FRECUENCIAS no generar
ningn resultado.

Figura 5-24

Este mensaje se debe a que por defecto el procedimiento Frecuencias slo realiza
las tablas de frecuencia y a menos que se le especifique opciones como los estadsticos o los
grficos, no producir ningn resultado. Al hacer clic en Aceptarse desactivar la
opcin Mostrar tablas de frecuencia con lo que garantizamos que sean excluidas de los
resultados [Fig.5-25]. Para comprobar que han sido desactivadas las tablas de frecuencia,
debemos fijarnos en la casilla de seleccin que aparece al costado izquierdo de la opcin y
notar que haya desaparecido el visto bueno ( ).
Figura 5-25

Ahora que desactivamos las tablas de frecuencias, le pediremos al procedimientoque nos


genere los estadsticos correspondientes a las medidas de dispersin, medidas de posicin
central y las medidas de distribucin, para lo cual hacemosclic en el botn Estadsticos. Al
aparecer el cuadro de dilogo correspondiente [Fig.5-26], seleccionaremos los diferentes
parmetros.

Figura 5-26

De las medidas de posicin no central escogemos nicamente los Cuartiles (Porcentajes 25, 50
y 75); adicionalmente, en las medidas de posicin central seleccionamos la Media,
la Mediana y la Moda; a su vez, en las medidas de distribucin seleccionamos la Asimetra y
la Curtosis y por ltimo en las medidas de dispersin activamos la Desviacin tpica,
la Varianza, la Amplitud, el Mximo, el Mnimo y el error tpico de la media.

Debemos recordar que para poder establecer si una medida ha sido activada, debe aparecer
en la casilla de seleccin ubicada al costado izquierdo de la medida un visto bueno ( ).
Despus de seleccionar correctamente cada una de las opciones hacemos clic en el
botn Continuar con lo que volvemos al cuadro de dilogo principal.

Una vez especificados los estadsticos debemos definir el tipo de grfico que deseamos
obtener, para lo que hacemos clic en el botn Grficos, de tal manera que aparece el cuadro
de dilogo correspondiente a Frecuencia: Grficos [Fig.5-27].
Figura 5-27

En este cuadro seleccionaremos la opcin Histogramas y seguido activamos la opcin Con


curva normal, para que le sea sobrepuesta una curva normal a la representacin grfica de los
datos. Una vez seleccionadas las opciones hacemosclic en Continuar con lo que volveremos al
cuadro de dilogo principal delprocedimiento Frecuencias.

En la siguiente leccin continuaremos definiendo las opciones del procedimiento y veremos los
resultados del procedimiento Frecuencias en variables de Escala.

Resultados - Frecuencias en variables de


Escala
Por ltimo activamos el botn Formato con lo que aparece el cuadro de
dilogo correspondiente [Fig.5-28]. Note como las opciones de la
seccin Ordenar por no se encuentran activas, esto se debe a que estas
opciones slo son aplicables a lastablas de frecuencia. Si nos fijamos en la
seccin Mltiples variables, notaremos que sus dos opciones se encuentran
disponibles; si eligiramos la opcinOrganizar resultados segn variables, el
programa generara una tabla de estadsticos y un histograma para cada
una de las variables.

Por el momento reuniremos todos los estadsticos en una sola tabla por lo
que mantendremos la opcin por defecto del programa (Compara variables).
Para proseguir hacemos clic en Continuar, volviendo al cuadro de dilogo
principal. Despus de definir todas las propiedades del procedimiento,
hacemos clic enAceptar con lo que se realizarn los clculos y los efectos
son expuestos en el visor de resultados de SPSS.

Si nos fijamos en los resultados, notaremos que las tablas de frecuencias no


fueron incluidas, adems los estadsticos de las dos variables son
expuestos en la mismatabla y se realiza un histograma por cada una de las
variables e incluyen una curva de normalidad sobre puesta.

Si nos fijamos en la tabla de estadsticos [Fig.5-29], notaremos que aparece


en la parte superior de la tabla una pequea descripcin de los valores
validos y perdidos de cada una de las variables seleccionadas (Edad del
encuestado y Aos estudiados). Al observar el valor correspondiente a la
variable Aos estudiados, notamos que aparecen 296 valores validos y 4
perdidos. Despus de la informacin de las variables, aparecen todos los
estadsticos que le pedimos alprocedimiento.

Figura 5-29

Para facilitar la interpretacin, hemos resaltado en la tabla de la figura [5-


29], las diferentes medidas tratando de agruparlas de acuerdo a sus
caractersticas. Por defecto el programa ubica a continuacin
del resumen de los datos, las medidas de tendencia central (Media,
Mediana y Moda); adems, incluye el Error tpico de la media.

Si nos fijamos en las medidas de distribucin (Asimetra y Curtosis),


notaremos que el programa por defecto adiciona los Errores tpicos de estas
medidas. El Error tpico es una disposicin de ajuste, la cual nos informa
que estas medidas pueden variar entre el rango de ms o menos el error
tpico ((Asimetra = -.179 .141); es decir, la asimetra va desde -.320 hasta
-.038). Entre mayor sea el valor de error, mayor ser la variacin de los
datos. De igual manera, se puede emplear el valor del error tpico con
la Curtosis y la Media.

Si ahora nos fijamos en los grficos [Fig.5-30], notaremos que cada uno de
ellos cuentan con las mismas caractersticas de los grficos de barras
utilizados en las variables categricas; es decir, las frecuencias se ubican
en el eje vertical (Eje Y) y los rangos en el eje horizontal (Eje X). Adems,
este tipo de grficos incluye otros datos como la Media, la Desviacin
tpica y el nmero de respuestas validas quien es representado por la letra
ene (N); as mismo se incluye una curva normal para identificar la
distribucin de los datos.

Figura 5-30

Estas grficas son particularmente tiles ya que con ellas podemos saber si
los datos se agrupan en un punto especfico o si por el contrario su
agrupacin no es constante, por lo cual se suelen presentar una elevado
nmero de rangos. Debemos recordar que los histogramas son un apoyo
visual a los resultadosmatemticos y que su funcin es generar una idea
visual del comportamiento de los datos.

A pesar que los resultados obtenidos mediante


el procedimiento Frecuencias son bastante claros y tiles, SPSS cuenta con
otro procedimiento mucho ms eficiente para el anlisis descriptivo de los
datos en las variables de escala, cuyosresultados son ms precisos.
Este procedimiento es definido bajo el nombre deDescriptivos y su
aplicacin esta restringida al uso exclusivo de las variables deEscala.

Procedimiento Descriptivos de SPSS


El procedimiento Descriptivos muestra estadsticos de resumen univariados
para varias variables en una nica tabla y a su vez, clcula valores
tipificados (puntuaciones z). Las variables se pueden ordenar por el tamao
de sus medias (en orden ascendente o descendente), alfabticamente o por
el orden en el que se seleccionen las variables (el valor por defecto).

Cuando se guardan las puntuaciones z, stas se aaden a los datos del


Editor de datos y quedan disponibles para los grficos, el listado de los
datos y los procedimientos anlisis. Cuando las variables se registran en
unidades diferentes (por ejemplo, producto interior bruto per cpita y
porcentaje de alfabetizacin), una transformacin de puntuacin z pondr
las variables en una escala comn para poder compararlas visualmente con
ms facilidad. Desde luego, estos parmetros (Puntuaciones z), son tiles
nicamente en el anlisis de inferencia de la informacin.
Para comprender los alcances del procedimiento Descriptivos, vamos a
generar unejemplo con las variables Edad del encuestado (Edad) y Aos
estudiados (Educaos). Para activar el procedimiento debemos ir al
men Analizar.. Estadsticos descriptivos y seleccionar la
opcin Descriptivos... [Fig.5-31], al hacer clic sobre ella aparece el cuadro
de dilogo correspondiente [Fig.5-32]. Este cuadro tiene una gran
semejanza con el empleado en el procedimiento frecuencias, con la
diferencia que solo cuenta con un botn de opcin y adems nos ofrece la
posibilidad de guardar los valores tipificados como variables para lo cual
crea y guarda una variable de puntuaciones-z para cada variable
seleccionada. Se crean nuevos nombres de variable anteponiendo la letra z
a los primeros siete caracteres del nombre original de la variable, por el
momento no profundizaremos en este tema ya que su aplicacin esta
definida para el anlisis inferencial de los datos.

Figuras 5-31 y 5-32

Al igual que en la mayora de los cuadros de dilogo de los diferentes


procedimientos del paquete, lo primero que debemos hacer es ubicar las
variables de inters en el listado de variables y posteriormente llevarlas
hasta la casilla de seleccin. Una vez definidas las variables hacemos clic
en el botn Opciones con lo que aparecer el cuadro de dilogo
correspondiente [Fig.5-33].

En este cuadro encontraremos todas las medidas del procedimiento, as


como tambin las opciones de orden. Por defecto el programa mantiene
seleccionadas las opciones Media, Desviacin tpica, Mnimo y Mximo, as
como el orden de visualizacin de acuerdo a la lista de variables. Para
el ejemplo utilizaremos estas medidas pero adems le solicitaremos la
varianza, la amplitud, el error tpico de la media, la Curtosis y la asimetra,
de manera que el cuadro se vea como la figura [5-34].
Figuras 5-33 y 5-34

Una vez seleccionadas las opciones hacemos clic en el botn Continuar con
lo que volveremos al cuadro de dilogo principal. Para finalizar hacemos clic
en el botnAceptar con lo que se realizan los clculos de las medidas y las
conclusiones son expuestas en el visor de resultados de SPSS [Fig.5-35].

Figura 5-35

Por defecto, el programa genera una sola tabla en la que incluye los
resultados de todas las variables seleccionadas. Si nos fijamos en los
resultados notaremos que la tabla se extiende en forma horizontal debido a
que ahora las variables se ubican en las filas y los estadsticos en las
columnas, lo cual nos impide observarla en su totalidad, para poder tener
una mejor comprensin de los resultados, en la siguiente leccion vamos a
cambiar el eje en el que se encuentran cada uno de los factores, es decir
vamos a ubicar las variables en el eje vertical y los estadsticos en el eje
horizontal, con lo que podremos mejorar la percepcin de los resultados.
Resultados Procedimiento Descriptivos de
SPSS
Dado que los resultados de la tabla no se pueden apreciar fcilmente,
vamos a emplear las propiedades interactivas de los resultados
de SPSS para modificar su forma, con el fin de aclarar su interpretacin.
Para realizarlo, debemos activarprimero la tabla haciendo doble clic sobre
ella, de modo que aparezca a su alrededor un marco de lneas
entrecortadas y a su vez, se presente la barra de herramientas de formato
[Fig.5-36]. Una vez surge la barra de herramientas, hacemos clic en el botn
Controles de pivote ( ), ubicado al costado izquierdo de barra.

Figura 5-36

Si por algn motivo no aparece la barra de herramienta, SPSS nos ofrece la


posibilidad de abrir los controles de pivoteado a travs del men
desplegable. Para realizarlo, basta con hacer clic derecho sobre la tabla,
con lo que surgir el men [Fig.5-37]. Una vez se activa el men, ubicamos
en l la opcin Paneles de pivoteado y sucesivamente hacemos clic sobre
ella, de modo que emerja el cuadro de pivoteado [Fig.5-38]. Por defecto el
programa ubica las variables en la dimensin de las Filas, mientras que
los Estadsticos y el Tipo de estadstico lo ubica en la dimensin de las
Columnas. El parmetro tipo de estadstico hace referencia si se trata del
estadstico o por el contrario se trata de su correccin (Error tpico).

Figuras 5-37 y 5-38

Si ubicamos el puntero del ratn sobre cualquiera de los iconos, aparecer


una pequea leyenda informativa sobre el parmetro al que representa.
Continuando con el ejemplo, intercambiaremos en el panel de pivotado los
parmetros que se encuentran en las Filas con los que se encuentran en las
Columnas. Para lograrlo, debemos hacer clic sobre los iconos
representativos de cada parmetro ( ) y mantenindolo oprimido lo
arrastramos hasta ubicarlo en el eje deseado, en donde soltamos el clic de
manera que el icono se incrusta de forma fija en la nueva coordenada. Este
proceso se debe realizar con cada uno de los parmetros de latabla, que
para este ejemplo corresponden en las columnas (Estadsticos y tipo
estadstico) y en fila (Variables) ver [Fig.5-39].

Figura 5-39

Es de gran importancia mantener el orden estricto de las variables ya que


de lo contrario obtendremos un formato de tabla distinto; para evitar este
inconveniente es necesario ubicar el parmetro Estadstico antes que el
parmetro Tipo de estadstico. Estos temas sern explorados a profundidad
en el captulo 8, por lo que no haremos una explicacin ms amplia de los
elementos. Una vez realizado el cambio de coordenadas para cada uno de
los parmetros, obtendremos comoresultado la tabla ordenada en forma
vertical, con las variables en las Columnas y los estadsticos en las Filas
[Fig.5-40]. Para finalizar el pivotado basta con hacer clic en la parte externa
de la tabla.
Figura 5-40

Si nos fijamos en la tabla observaremos que los resultados son muy


similares a los obtenidos con el procedimiento Frecuencias, con la
diferencia que a travs del procedimiento Descriptivos se incluyen de forma
automtica para todas las medidas los errores tpicos (s existen). Si
observamos las etiquetas de las columnas, notaremos que aparece cada
una de las variables (Edad del encuestado y Aos estudiados), pero
adems se anexa la columna N vlido (segn lista), la cual identifica los
valores validos para las dos variables.

Para calcular este valor, el programa exime los valores perdidos de las dos
variables, dado que en este caso los Aos estudiados es la nica variable
que cuenta con valores perdidos, el programa slo exime los cuatro valores
perdidos de esta variable. Por otro lado, si observamos las filas notaremos
que cada una de las medidas define una fila y a su vez cada medida incluye
el valor del estadstico y el valor del error tpico. Por ltimo notaremos que
este procedimiento no realiza ningn tipo de grfico de forma automtica, lo
que nos implica que si deseamos obtenerlo, es necesario realizarlo
mediante los procedimientos grficos con que cuentaSPSS.

Si por algn motivo llegamos a encontrarnos con un termino estadstico


dentro de los resultados que desconozcamos o sencillamente no
recordemos, SPSS nos permite obtener informacin referente a ellos
simplemente haciendo doble clic sobre la tabla de forma que se active el
recuadro; una vez activo hacemos clic derecho sobre el termino que
deseamos conocer, de modo que aparezca el men desplegable [Fig.5-41]
y posteriormente seleccionar dentro de el men la opcinAsesor de
resultados con lo cual aparecer una nueva ventana del Tutorial, en donde
encontraremos una leyenda que nos informa su significado [Fig.5-42].

Figuras 5-41 y5-42

Debemos recordar que este sistema de ayuda esta basado en ventanas


mltiples lo cual nos garantiza que obtendremos diversa informacin acerca
del elemento deseado. Para poder explorar la mayora de las ventanas de
esta ayuda, debemos emplear los botones que aparecen al costado inferior
derecho; para avanzar de pgina debemos hacer clic en el botn Siguiente (
); si por el contrario deseamos devolvernos una pgina, entonces
debemos oprimir el botn Anterior ( ). A travs del botn ndice ( )
regresaremos a la tabla de contenido del sistema de ayuda y a su vez con el
botn Buscar ( ), podemos ubicar una palabra en los diferentes contenidos
de la ayuda.

En conclusin el procedimiento Descriptivos nos permite obtener los


estadsticos de resumen para varias variables de escala, agrupando los
resultados en una solatabla, con la ventaja que nos permite obtener y
guardar los valores tipificados (puntuaciones z), lo cual es de gran utilidad
para los anlisis de inferencia. Su principal desventaja radica en el reducido
nmero de estadsticos que podemos seleccionar, as como en la
imposibilidad de generar un grfico con el procedimiento.

ANALISIS DESCRIPTIVO - CURSO GRATIS


Una de las principales funciones de la estadstica consiste en la descripcin
de losdatos; ya sea por medio de medidas (estimadores), grficos
o tablas en las que se puedan apreciar claramente el comportamiento y las
tendencias de la informacin recopilada. SPSS cuenta con una serie de
procedimientos para realizar esta labor, cada uno de los cuales nos ofrece
diversas posibilidades y su aplicacin depende de las caractersticas de la
informacin que contenga cada variable.

Antes de iniciar con el anlisis descriptivo de datos a travs de SPSS, es


necesario aclarar algunos conceptos fundamentales de la estadstica, los
cuales son de vital importancia para la correcta interpretacin de los
resultados que ofrecen los diferentes procedimientos del paquete.

Debemos recordar que la estadstica es un sistema o mtodo empleado en


la recoleccin, organizacin, anlisis e interpretacin de los datos. Esta
ciencia se divide en dos fases; la primera corresponde a la Estadstica
descriptiva, cuya finalidad es agrupar y representar la informacin de forma
ordenada, de tal manera que nos permita identificar rpidamente aspectos
caractersticos del comportamiento de los datos. La segunda fase
corresponde a la Estadstica de Inferencia, la cual busca dar explicacin al
comportamiento o hallar conclusiones de un amplio grupo de individuos,
objetos o sucesos a travs del anlisis de una pequea fraccin de sus
componentes (Muestra).

En este captulo nos concentraremos exclusivamente en la Estadstica


Descriptiva y los procedimientos que la componen, como las medidas de
tendencia central, medidas de distribucin y las medidas de
dispersin. Antes de conocer cada una de estas medidas es necesario
resaltar la diferencia entre Poblacin y Muestra. Se denomina Poblacin al
total de los elementos que componen un conjunto, el cual es el objeto de
inters de un estudio.

Las poblaciones pueden ser finitas o infinitas de acuerdo si se conoce el


total de los elementos que la componen o no. Generalmente es bastante
difcil realizar un estudio con el total de la poblacin, ya sea por que es
demasiado grande, requiere demasiado tiempo para su anlisis, los costos
son muy elevados, se desconoce el total de elementos, etc.

Por estas razones se suele sustraer una pequea fraccin de la poblacin


para realizar los anlisis; de tal manera que las conclusiones que se
extraigan sobre la fraccin sean aplicables a la poblacin. A esta fraccin se
le denomina Muestra y cada uno de los procedimientos estadsticos
presentan algunas variaciones en sus ecuaciones de acuerdo si
los datos representan muestras o poblaciones.

CAPITULO 6
Tablas de Contingencia o Cruzadas con
SPSS
Las tablas de contingencia nos permiten realizar comparaciones de
Relacin / Independencia entre dos o ms variables categricas, ya sean de
tipo Nominal uOrdinal. En este tipo de tablas se definen las categoras de
una variable a travs de la frecuencia o el porcentaje de las categoras de
una segunda variable.

Para comprender el concepto nos apoyaremos en los resultados de la encuesta piloto realizada
a 20 personas cuyas preguntas son Gnero del encuestado? yTiene telfono celular?. Los
resultados de estas preguntas se plasman en lastablas de la figura [6-1]. Si nos fijamos en los
resultados de la tabla del Gnero, notaremos que el 35 % de los encuestados corresponde a
los hombres, mientras el 65 % restante corresponde a las mujeres.

As mismo, si nos fijamos en la tabla de tenencia de telfono celular, observaremos que el 40


% de los encuestados si tiene, mientras el 60 % no tiene. A travs de unatabla de contingencia
podemos obtener la relacin de estas dos preguntas, identificando aspectos como cuntos
hombres tienen telfono celular? o cuantas mujeres no tienen telfono celular?.

Figura 6-1

Para generar una tabla de contingencia, es necesario vincular las categoras de una de las
variables en las Filas y las categoras de la segunda variable en las Columnas. Si introducimos
las categoras de la variable Gnero en las Filas y las categoras de la variable
Telfono celular en las Columnas obtendramos la tabla de la figura [6-2], en donde la posicin
uno (1) representa a los hombres que tienen telfono, la posicin dos (2) representa a los
hombres que No tienen telfono; la posicin tres (3) representa a las mujeres que tienen
telfono y la posicin cuatro (4) a las mujeres que No tienen telfono.
Para hallar la frecuencia de cada una de estas opciones, es necesario acudir a los datos y
verificar cuantos de los hombres y mujeres tienen telfono y cuantos no. Los resultados de
este procedimiento son expuestos en la figura 6-3. Adems de las frecuencias de cada uno de
los cruces de categoras, tambin se acostumbra introducir Totales en las filas y columnas, con
el fin de obtener la mayor cantidad de informacin posible de las variables.

Figuras 6-2 y 6-3

Si nos fijamos en la tabla de la figura [6-3], notaremos que los dos totales dan
comoresultado final, el nmero de encuestados (que para el caso corresponde a 20). La nica
condicin que debe cumplir un caso (Respuestas de un encuestado) para ser incluido en
la tabla de contingencia, es tener una respuesta o valor valido en las dos o ms variables que
compongan la tabla de lo contrario, el caso ser excluido. Porejemplo, si uno de los
encuestados no responde la pregunta del Gnero, pero si la del Telfono o viceversa, el caso
ser excluido al momento de generar la tabla de contingencia.

Las tablas de contingencia pueden servir a diferentes propsitos como el anlisis descriptivo,
en cuyo caso el objetivo es proporcionar informacin condensada que describa las categoras
de las variables involucradas, sin realizar comparaciones explicitas que generen conclusiones
de una poblacin. A su vez este tipo de tablastambin pueden ser empleadas para la
generacin de anlisis de Inferencia, en donde se intenta extraer conclusiones sobre las
relaciones de las variables que puedan ser aplicadas a una poblacin.

Para este objetivo se emplean pruebas estadsticas a los datos de una muestra (por lo general
la prueba de independencia de Chi-cuadrado). Para generar unatabla de contingencia es
necesario tener un archivo de datos abierto en el Editor de datos de SPSS. Los ejemplos de
este captulo se realizarn con los datos delarchivo Cruces.sav incluido en la
carpeta Captulo6 del CD adjunto, por lo que debemos ir al men Archivo..Abrir..Datos y por
medio de la ventana de navegacin ubicar el archivo en la unidad de CD ROM.

Una vez abierto el archivo, podemos ejecutar el procedimiento, el cual se encuentra en el


men Analizar... Estadsticos descriptivos...Tablas de contingencia [Fig.6-4]; al hacer clic sobre
el procedimiento aparece el cuadro de dilogo correspondiente [Fig.6-5]. Este cuadro de
dilogo esta dividido en cuatro secciones (Lista de variables, Casillas de seleccin, Opciones
de resultados y Botones de opcin).

Figuras 6-4 y 6-5

En la seccin Casillas de seleccin, encontramos las tres ubicaciones que podemos emplear
para las variables de la tabla (Filas, Columnas o Capas); alingresar una variable a la casilla
Filas, sus categoras definen cada una de las filas de datos de la tabla; a su vez al ingresar una
variable en la casilla Columnas, sus categoras definen cada una de las columnas de la tabla.

Si se ingresan mltiples variables a una de las casillas, el programa genera unatabla de


contingencia para cada combinacin de variables de fila y columna. Por ltimo encontramos la
casilla de Capa; al ingresar una variable en esta casilla, el programa genera una tabla de
contingencia para cada una de las categoras de la variable de Capa.

Para comprender mejor la metodologa empleada en las tablas de contingencia y los elementos
que nos facilita el procedimiento, en las siguientes lecciones vamos a generar una serie de
ejemplos, intentando aumentar la complejidad de forma gradual.

Tablas Cruzadas con 2 y 3 Variables en


SPSS
Para comprender mejor la metodologa empleada en las tablas de
contingencia y los elementos que nos facilita el procedimiento, vamos a
generar una serie deejemplos, intentando aumentar la complejidad de forma
gradual. Para nuestro primer ejemplo, vamos a generar una tabla de
contingencia simple.

Para realizarlo, debemos ubicar en la lista de variables la variable Estado


civil y la ingresamos en la casilla de las filas; sucesivamente ubicamos la
variable Gnero del encuestado y la ingresamos en la casilla Columnas.
Despus de introducir las variables en las casillas hacemos clic
en Aceptar con lo que la tabla ser creada en el visor de resultados
de SPSS [Fig.6-6].

Por defecto el programa genera dos tablas; la primera resume el


procesamiento de los casos, mostrando el nmero de casos validos y
perdidos, as como sus respectivos porcentajes. Esta tabla es meramente
informativa y su utilidad radica en la capacidad de informarnos el nmero
casos que son tenidos en cuenta en los resultados de la tabla de
contingencia (Frecuencias o porcentajes). Si nos fijamos en la columna
correspondiente a perdidos, notaremos que en esta ocasin no existe
ningn valor perdido; para que un caso sea tomado como perdido, debe
contar con un valor perdido en alguna de las dos variables involucradas en
la tabla.
Figura 6-6

La segunda tabla que aparece en los resultados corresponde directamente


a latabla de contingencia, en ella se ubican cada una de las variables en sus
respectivas dimensiones (Estado civil en las filas y Gnero en las
columnas); adems, en la tabla se vinculan los totales de las dimensiones,
especificando el contenido de cada categora. Esta es sin ninguna duda la
aplicacin ms sencilla de una tabla de contingencia, ya que su finalidad es
netamente descriptiva.

Ahora generaremos una tabla un poco ms compleja ingresando una nueva


variable en la dimensin de capa. Para lograrlo debemos volver al cuadro
de dilogo, ubicar la variable Clase social (Claseso) en la lista e ingresarla
en la casilla de capa; despus de ingresarla hacemos clic en Aceptar con lo
que la tabla se genera en el visor de resultados [Fig.6-7].
Figura 6-7

Si nos fijamos en la tabla de resumen del procesamiento de los datos,


notaremos que en esta ocasin slo se tuvieron en cuenta 299 casos
correspondientes al 99.7 % de los datos; esto se debe a que uno de los
casos no cuenta con respuestasvalidas para las tres variables y por lo tanto
es omitido del anlisis. Asimismo, si nos fijamos en la tabla de contingencia,
notaremos que el programa ha generado cuatro diferentes divisiones (una
por cada categora de la variable Clase social), ubicndolas una debajo de
otra.

Cada una de estas divisiones describe las caractersticas del Gnero y


estado civil de los individuos pertenecientes a la categora o clase social
(Alta, Media,Trabajadora y Baja). Si observamos los totales de cada
categora de la Clase Social, apreciaremos que cada uno de ellos cuenta
con un valor diferente, este suceso se debe a que en las tablas de
contingencia de mltiples variables, los totales no representan
la frecuencia de las variables de Fila sino describen las frecuencias de las
categoras de la variable de Capa.

Gracias a esta propiedad podemos conocer informacin especifica como


Cuantos individuos de clase baja estn casados? Cuntas mujeres de
clase media viven en Unin libre?; para ubicar esta informacin en
la tabla de contingencia, debemos partir de las caractersticas de mayor
rango e ir ubicando dentro de ella las de menor rango; es decir, si por
ejemplo queremos conocer el nmero de individuos de clase media que se
encuentran Divorciados, lo primero que debemos hacer es ubicar la clase
social Media, dentro de ella ubicamos la categora de inters (estado civil
Divorciado) y una vez ubicada seguimos la fila hasta encontrar la columna
Total; el valor que se ubique en esta posicin corresponde al nmero de
personas que cumplen con las condiciones requeridas, que para el caso
seria (19); lo que nos indicara que 19 personas de la encuesta son de clase
media y a su vez se encuentran divorciados.

Si por el contrario lo que deseamos es conocer el nmero de hombres de la


clase trabajadora que son solteros, lo que debemos hacer es ubicar primero
la divisin correspondiente a la clase trabajadora, en ella ubicamos el
Estado civil Soltero y seguimos su fila hasta llegar a la columna Masculino;
el valor que se encuentra en esta casilla (39), representa al nmero de
hombres de clase trabajadora que son solteros [Fig.6-8].

Figura 6-8

En algunas ocasiones parte de las categoras de la variable de Fila, no son


incluidas dentro de las divisiones debido a que no se encuentran valores
pertenecientes a estas categoras dentro de los datos. Si nos fijamos en la
categora correspondiente a la Clase social Baja de la tabla de contingencia
[Fig.6-9], notaremos que las categoras del Estado civil (Divorciado y Unin
libre), no son incluidas en los resultados.

Figura 6-9

Debemos tener cuidado de no sacar conclusiones apresuradas de este tipo


de sucesos, ya que este fenmeno no necesariamente es un reflejo
delcomportamiento de la poblacin, sino que puede ser producido por un
error en la aleatoriedad de los individuos seleccionados para la encuesta,
comnmente denominado Sesgo muestral (Tendencia a favorecer una clase
social por parte del investigador).
Tablas Cruzadas con 3 Variables en SPSS
Otra de las aplicaciones que se pueden generar con las tablas de
contingencia se presenta cuando se ingresan mltiples variables en las
casillas de Fila o Columna; en este caso el programa genera una tabla de
contingencia por cada una de las posibles combinaciones entre las
variables. Para comprender este procedimiento, vamos efectuar
un ejemplo ingresando dos (2) variables dentro de la casilla columnas.

Para realizarlo debemos volver al cuadro de dilogo e ingresar la variable


Clase social (Claseso) dentro de la casilla Columnas; dado que esta
variable se encuentra en el panel de Capa, debemos primero devolverla a
la lista de variables (Seleccionarla y hacer clic en el botn flecha de
desplazamiento) y una vez se encuentra en la lista, la ingresamos a la
casilla Columnas. Para finalizar hacemosclic en Aceptar con lo cual
las tablas sern creadas en el visor de resultados deSPSS [Fig.6-10].

Figura 6-10
Como de costumbre, el programa nos ofrece primero
la tabla correspondiente alresumen del procesamiento de los casos; si nos
fijamos en la combinacin Estado civil * Clase social, notaremos que se
excluy uno de los casos, debido a que cuenta con un valor perdido para la
variable Clase social. Ahora si observamos los resultados subsecuentes,
notaremos como aparecen las tablas de contingencia de cada una de las
posibles combinaciones entre las variables (Estado civil * Gneroy Estado
civil * Clase social). Cada una de estas tablas son independientes y los
resultados de las casillas no se ven afectados por la variable que no sea
relacionada.

Ahora, si por el contrario se ingresan mltiples variables en la casilla


de Capa, tendramos dos opciones; la primera es generar tablas de
contingencia diferentes para cada una de las variables de capa y la segunda
corresponde a seguir aumentando el nmero de variables de control dentro
de la misma tabla; es decir, apareceran ms divisiones en las que se
incluiran las variables de filas y columnas, as como las categoras de la
primera variable de Capa, aumentando el tamao de la tabla.

Para definir variables de capa de segundo nivel debemos


primero ingresar una variable a la casilla de capa (esta primera variable
queda automticamente definida como variable de control de primer nivel),
para definir una segunda variable de control de segundo nivel debemos
hacer clic en el botn siguiente que aparece al costado derecho de la
seccin, antes de ingresarla a la casilla [Fig.6-11]. SPSSnos permite definir
hasta 8 diferentes niveles de variables de control con un mximo de seis
variables por nivel. Desde luego a medida que se aumente el nmero de
variables de capa, aumentar la complejidad de la tabla y sucesivamente se
reduce el valor de los totales, ya que se hace una descripcin ms
especfica de los datos.

Figura 6-11

Por el momento no profundizaremos en los efectos de incluir mltiples


variables en las capas y por el contrario nos enfocaremos en las dems
secciones delprocedimiento. La segunda seccin del cuadro de dilogo de
las tablas de contingencia corresponde a las Opciones de resultados; en
esta seccin se encuentran las opciones Mostrar grfico de barras
agrupado y Suprimir tablas.

Al activar la primera de las opciones aparecern en los resultados los


grficos de cada una de las tablas de contingencia; si se emplean variables
de capa, el programa genera un grfico de barras por cada una de las
divisiones o categoras de esta variable (Capa).

Los grficos de barras de este procedimiento, slo se realizan en dos


dimensiones y sus ejes estn definidos por la variable preincorporada
Recuento en el eje vertical, la variable de Filas en el eje horizontal y la
variable que se encuentre en las Columnas como variable de leyenda de
Color. Si a su vez se selecciona la opcin Suprimir tablas, los resultados
del procedimiento slo contendrn los grficos de las tablas de
contingencia.

Para comprender estas opciones en la siguiente leccion

Graficos en las Tablas Cruzadas con SPSS


Para comprender los efectos de estas opciones generaremos
algunos ejemplos. Antes de crear la tabla debemos volver al cuadro de
dilogo y hacer clic en el botn Restablecer con lo cual se retoma la
configuracin original del procedimiento. Para el
primer ejemplo ingresaremos la variable Estado civil (Estciv) en la casilla
Filas y la variable Gnero del encuestado en la casilla Columnas, a
continuacin activamos la opcin Mostrar los grficos de barras
agrupado, haciendo clic sobre la opcin; para comprobar que la opcin ha
sido activada aparece un visto bueno en la casilla ( ); para finalizar
hacemos clic en Aceptar con lo que los resultados se crean en el visor
[Fig.6-12].
Figura 6-12

Si nos fijamos en los resultados notaremos que ahora aparece adems de


lastablas de recuento y contingencia, su respectivo grfico; es necesario
resaltar que el grfico hace una comparacin de la frecuencia del Gnero
por cada uno de los estados civiles. Si observamos cada una de las barras
notaremos que cuentan con colores distintos para el gnero Femenino y
Masculino, esto se debe a que la variable Gnero define la leyenda de color
y por lo tanto sus categoras cuentan con colores distintos para facilitar su
reconocimiento.

Ahora generaremos un ejemplo con variables de Capa, para lo que


volvemos al cuadro de dilogo e ingresamos la variable Clase social en la
casilla de Capa y posteriormente activamos la opcin Suprimir tablas; para
finalizar hacemos clic enAceptar con lo cual los grficos sern creados en el
visor de resultados [Fig.6-13].
Figura 6-13

Si nos fijamos en los resultados notaremos que cada uno de los grficos
representa la distribucin de frecuencias de una de las categoras de las
variables de capa (para el caso Clase social); en estos grficos el nmero
de casos que se incluyen depende de la frecuencia de la variable de capa,
adems es posible que algunas de las Categoras de la variable de Filas
(eje horizontal), no sean incluidas, debido a que no aparecen en los datos
de encuestados con estas caractersticas.

La ltima seccin que encontramos en el cuadro de dilogo


del procedimientoTablas de contingencia corresponde a los Botones de
opcin; en ellos se localizan las propiedades para definir el orden, la forma
de los resultados, las pruebas estadsticas o la precisin de los anlisis.
Para describir estas opciones, en la siguiente leccion realizaremos una serie
de ejemplos iniciando por las propiedades ms sencillas e iremos
aumentando la complejidad.

Opciones de las Tablas Cruzadas de SPSS


La ltima seccin que encontramos en el cuadro de dilogo
del procedimientoTablas de contingencia corresponde a los Botones de
opcin; en ellos se localizan las propiedades para definir el orden, la forma
de los resultados, las pruebas estadsticas o la precisin de los anlisis.
Para describir estas opciones, en la siguiente leccion realizaremos una serie
de ejemplos iniciando por las propiedades ms sencillas e iremos
aumentando la complejidad.

Para activar la totalidad de los botones de opcin es necesario que la


propiedad Suprimir tablas este desactivada.. La primera opcin que
observaremos corresponde al Botn de Formato; al hacer clic en l, aparece
el cuadro de dilogo correspondiente [Fig.6-14]. En este cuadro
encontramos las opciones de orden de la tabla de contingencia, a travs de
ellas podemos elegir la forma en que sern ordenados los resultados,
contando con slo dos posibilidades (Ascendente o Descendente); las
opciones de orden hacen referencia a la manera como se ubican las
categoras de la variable de Filas y se determina de acuerdo al valor
(Nmero) que se le haya asignado a cada categora en las propiedades de
variables.

Figura 6-14

Por defecto el programa mantiene la opcin Ascendente preseleccionada, lo


que nos garantiza que las categoras mantendrn el mismo orden que se le
haya definido a las variables. Por el momento no variaremos el orden de las
filas por lo que hacemos clic en el botn Continuar, de manera que
volvemos al cuadro de dilogo principal. El segundo botn de opcin que
encontramos corresponde aCasillas; al hacer clic en l aparece el cuadro de
dilogo Mostrar en casillas [Fig.6-15]. En este cuadro encontramos tres
secciones de seleccin para las casillas identificadas
como Frecuencias, Porcentajes y Residuos.

Figura 6-15

En la seccin Frecuencias encontramos las opciones Observadas y


esperadas; las frecuencias Observadas corresponden a los recuentos de los
datos del archivo, mientras las frecuencias Esperadas hacen referencia al
nmero de observaciones que deberan hallarse en cada casilla para que no
exista una relacin estadsticamente significativa entre las variables de
Columnas y Filas; desde luego esta opcin es slo aplicable al anlisis de
inferencia.

La segunda seccin corresponde a Porcentajes, en ella se puede definir los


porcentajes que se anexarn a la tabla de contingencia; entre las opciones
que nos brinda el procedimiento estn los porcentajes de Fila, Columna y
Total (Capa). La ltima seccin corresponde a los Residuos; entre las
opciones de residuo encontramos No tipificados (representan la diferencia
entre las frecuencias observadas y las esperadas; un residuo positivo indica
que la frecuencia en la casilla es ms alta de los que habra en ella si las
variables de fila y columna fueran independientes), Tipificados (El residuo
dividido por una estimacin de su error tpico; estos residuos tienen una
media de 0 y una desviacin tpica de 1) yTipificados
corregidos (corresponde al valor no tipificado dividido por una estimacin de
su error tpico.

Estos valores expresan unidades de desviacin tpica, por encima o por


debajo de la media); Los residuos son empleados para la comprobacin de
ciertos parmetros de la estadstica de inferencia, por el momento no
profundizaremos en este tema ya que no se encuentra dentro de los
objetivos del libro.

Para la versin 12.0 de SPSS, el procedimiento Tablas de


contingencia anexa en el cuadro de dilogo Mostrar en las casillas una
cuarta seccin identificada comoPonderaciones no enteras. Esta nueva
seccin se incluye debido a que generalmente los recuentos de las casillas
suelen ser valores enteros, ya que representan el nmero de casos de cada
casilla.

Sin embargo, si el archivo de datos est ponderado en un momento


determinado, por una variable de ponderacin con nmeros fraccionarios
(por ejemplo, 1,25), los recuentos de las casillas pueden resultar con
valores decimales. A travs de esta seccin se puede truncar o redondear
estos valores antes o despus de calcularlos recuentos de las casillas o
bien utilizar recuentos de casillas fraccionarios en la presentacin de
las tablas y los clculos de los estadsticos.

Si se selecciona la opcin Redondear frecuencias de casillas, las


ponderaciones de los casos se utilizan tal cual, pero los valores de las
casillas se redondean antes de calcular cualquier estadstico. Si por el
contrario se emplea la opcin Truncarfrecuencias de casillas, las
ponderaciones de los casos se utilizan tal cual, pero las ponderaciones
acumuladas de las casillas se omiten antes de calcular cualquier
estadstico.
Si se selecciona la opcin Redondear ponderaciones de casos, las
ponderaciones de los casos se redondean antes de utilizarlas. Al
seleccionar la opcin Truncarponderaciones de casos, las ponderaciones de
los casos se cortan antes de utilizarlas por lo que la tabla no tendr en
cuenta los valores de ponderacin. Si se utiliza la ltima opcin (Sin
ajustes), las ponderaciones de los casos se utilizan sin cambios y se
emplean valores fraccionarios en las frecuencias de cada casilla.

Sin embargo, cuando se solicitan estadsticos exactos (disponibles slo con


el mdulo Pruebas exactas), las ponderaciones acumuladas de las casillas
se trucan o se redondean antes de calcular los estadsticos de la prueba
exacta.

Porcentajes de Fila, Columna y Tabla de


SPSS
Una de las principales dificultades que se pueden presentar con
una tabla de contingencia, surge al momento de vincular dentro de
los resultados las opciones de porcentaje (Fila, Columna y Total);
generalmente la interpretacin de estos porcentajes ocasiona confusin al
momento de extraer las conclusiones.

Para comprender la metodologa empleada por el programa para la


generacin de estos parmetros, nos apoyaremos en el primer ejemplo de
este captulo, correspondiente a la encuesta piloto realizada a 20 personas
con las preguntas Gnero del encuestado? y Tiene telfono celular?.
Los resultados del cruce de estas dos variables se exponen en la tabla de la
figura 6-16. Es necesario aclarar que en las tablas de contingencia, el total
que se ubica en las columnas representa las sumas de las frecuencias de
las categoras de la variable de fila y el que se encuentran en las Filas
representa la suma de las categoras de la variable de columna.

Figura 6-16

En cada una de las casillas de una tabla de contingencia se pueden incluir


los valores de los porcentajes de Fila, Columna y Total (Tabla); para facilitar
la ubicacin e interpretacin, emplearemos como gua en la obtencin de
los porcentajes, los nmeros de identificacin de casilla de la tabla de la
figura [6-17].
Figura 6-15

A manera de ejemplo hallaremos el valor de cada uno de los porcentajes de


Fila, Columna y Total, empleando la metodologa del programa para la
obtencin de los clculos, en los datos de la tabla de la figura [6-16]. El
porcentaje de fila se obtiene al dividir la frecuencia de la casilla por el total
de la fila (los totales de fila se ubican en las casillas 5 y 6), y multiplicar
este resultado por el 100%. Por ejemplo, para sacar el porcentaje de fila de
la casilla 1 (Hombre y si tiene telfono celular), se debe dividir el valor de
la frecuencia (4), en el total de hombres (7) y multiplicar esteresultado por el
100%, es decir

Para las casillas 2, 3 y 4 sera:

Para los totales de columna (Casillas 7 y 8) seran:

Note que en los porcentajes de fila para los totales de columna, los valores
son divididos por el total de casos involucrados en la encuesta (20). Al
contrario de los totales de columna, para calcular el porcentaje de fila de los
totales que representan la dimensin (Filas), se debe realizar la suma de los
valores porcentuales de las casillas de la fila. Por ejemplo, el valor del
porcentaje de fila para el total de los hombres es igual a la suma de los
porcentajes de las columnas Si y No (Casillas 1 y 2 de la tabla de la figura
6-16); es decir

Al ingresar estos valores dentro de las respectivas casillas de la tabla de


contingencia obtendramos los resultados de la tabla de la figura [6-18].
Figura 6-18

Para obtener los porcentajes de Columna se aplica el mismo principio con la


diferencia que las frecuencias se dividen por los totales de columna (Valores
de la ltima fila casillas 7 y 8); al realizar los clculos obtendramos:

Para calcular los porcentajes de columna de los totales de la dimensin


(Columnas) casillas 7, 8 y 9 [Fig.6-16], se deben sumar los porcentajes de
las casillas de las columnas, con lo que tenemos

Al ingresar los valores a la tabla de contingencia obtendremos


los resultados de la figura [6-19].

Figura 6-19
Ahora, para obtener el porcentaje del Total (comnmente denominado %
de Tabla), es necesario dividir cada uno de los valores del recuento de cada
casilla por el nmero total de casos que se incluyeron en la tabla de
contingencia. Aplicado en elejemplo, equivale a tomar la frecuencia de cada
casilla y dividirla por el nmero de encuestas que para el caso corresponde
al nmero 20; los resultados de los clculos se observan en la tabla de la
figura 6-20. Dado que este tipo de porcentaje determina la proporcin de
cada casilla respecto al total de los datos (Encuestados), slo es posible
encontrar un valor del 100%, el cual equivale al total de casos.

Figura 6-20

Ahora que conocemos la metodologia empleada para calcular los distintos


porcentajes, en el siguiente capitulo nos concentraremos en la forma de
sacarlos con SPSS.

Porcentajes de Fila, Columna y Tabla con


SPSS
Ahora que conocemos la metodologa empleada por el programa para la
obtencin del valor de los porcentajes de Fila, Columna y Total (Tabla), nos
concentraremos en la forma de generarlos a travs del procedimiento, as
como la manera de interpretar los resultados en una tabla de contingencia.
Antes de sacar las conclusiones es necesario generar la tabla, por lo que
debemos volver al cuadro de dilogo ya sea mediante el botn Recuperar
cuadro de dilogo ( )o a travs de la ruta Anlisis..Estadsticos
descriptivos..Tablas de contingencia.

Una vez aparece el cuadro de dilogo, hacemos clic en el


botn Restablecer para retomar la configuracin inicial del procedimiento.
Para obtener los porcentajes es necesario definir primero las variables que
sern involucradas en la tabla, por lo que nos dirigimos a la lista de
variables, ubicamos la variable Estado civil (Estciv) y la ingresamos en la
casilla Filas; posteriormente ubicamos en el listado la variable Gnero del
encuestado y la ingresamos en la casilla Columnas. A continuacin
hacemos clic en el botn Casillas, de manera que aparezca el cuadro de
dilogo correspondiente, donde activamos las opciones de porcentajes para
Fila, Columna y Total.
Podemos cercioramos que los porcentajes han sido activados si aparece un
visto bueno en la casilla de seleccin ( ). Despus de activar las opciones,
hacemos clic en el botn Continuar con lo que volveremos al cuadro de
dilogo principal. Para finalizar hacemos clic en Aceptar de modo que
la tabla se crea en el visor deresultados de SPSS [Fig.6-21].

Las tablas de contingencia suelen introducir las etiquetas de las variables de


dimensin (Filas, Columnas) dentro de las leyendas de los porcentajes; esta
es una propiedad exclusiva de este procedimiento ya que en los dems
mtodos de creacin de tablas del paquete, aparecen generalmente
las leyendas %Fila, %Col y %Total. Para la tabla de la figura [6-21], la
leyenda (% de Estado civil) corresponde al porcentaje de Fila, la leyenda (%
de Gnero) al porcentaje de columna y la leyenda (% del total) al porcentaje
de tabla.

Figura 6-21

Si nos fijamos en los resultados de la tabla de contingencia, notaremos que


aparecen dentro de cada casilla tres porcentajes distintos (% de Estado
civil, %del Gnero y % del Total), cada uno de estos valores nos indica una
conclusin diferente y su interpretacin debe realizarse teniendo en cuenta
el tipo de porcentaje que representa. A manera de ejercicio se han resaltado
algunos valores en la tabla, Podra interpretarlos?.
Para interpretar el valor del porcentaje de Fila en una casilla,
debemos leer primero la categora de la fila y despus concluir sobre la
categora de la columna. Por ejemplo, si queremos interpretar el valor del %
de Estado civil (% de fila) resaltado en la figura [6-22], debemos leer primero
el valor 48.5%, sucesivamente la categora de la fila a la que pertenece
Soltero y concluir sobre la categora de la columna Masculino; al
organizar la oracin obtendramos (48.5% Soltero Masculino), lo que nos
indicara que el 48.5% de las personas solteras son hombres o tambin (de
las personas solteras el 48.5% corresponden al gnero masculino).
Debemos tener cuidado de no confundir el nombre de la categora con
las leyendasdel valor, para aclarar la ubicacin de estos dos parmetros se
anexan los ttulos de cada parmetro dentro de la tabla de la figura [6-22].

Figura 6-22

Para interpretar el valor del porcentaje de columna se invierte la accin; es


decir, se lee primero la categora de columna y se concluye sobre la
categora de la fila. Por ejemplo, para interpretar el valor del % de
Gnero (% Col) resaltado en la tabla de la figura 6-22,
debemos leer primero el valor (15.6%), sucesivamente la categora de
columna a la que pertenece (Femenino) y concluir sobre la categora de la
fila (Casado); al organizar la oracin obtendramos (15.6% Femenino
Casado), lo que nos indicara que el 15.6 % de las mujeres son casadas.

Por ltimo encontramos el porcentaje del total; para la interpretacin de


estos valores se debe tener en cuenta que sus conclusiones se hacen sobre
la totalidad de los encuestados y no sobre las categoras de cruce, por lo
que el orden de las categoras se basa en la gramtica de la oracin. Por
ejemplo, al interpretar el valor del % del total resaltado en la figura [6-22],
obtendramos que el 1.0% de los Encuestados son hombres casados los
hombres casados corresponden al 1 % de los encuestados.

Pruebas Estadisticas - Tablas de


Contingencia
Hasta ahora slo hemos empleado las tablas de contingencia de manera
descriptiva, sin involucrar las pruebas estadsticas de asociacin e
independencia. Para poder determinar si existe una relacin entre dos
variables no basta con los porcentajes o los recuentos, la relacin debe ser
comprobada mediante una prueba estadstica. Todas las pruebas con que
cuenta las tablas de contingencia se encuentran ubicadas dentro de las
opciones del botn Estadstico. Al hacer clic en l aparece el cuadro de
dilogo correspondiente [Fig.6-23].

Figura 6-23

Dentro de las diferentes pruebas estadsticas de asociacin que nos ofrece


el procedimiento encontramos el Chi-cuadrado de Pearson, Chi-cuadrado
de la razn de verosimilitud, prueba de asociacin lineal por lineal, prueba
exacta de Fisher, Chi-cuadrado corregido de Yates, r de Pearson, rho de
Spearman, coeficiente de contingencia, phi, V de Cramer, lambdas
simtricas y asimtricas, tau de Kruskal y Goodman, coeficiente de
incertidumbre, gamma, d de Somers, tau-b de Kendall, tau-c de Kendall,
coeficiente eta, kappa de Cohen, estimacin de riesgo relativo, razn de
ventajas, prueba de McNemar, estadsticos de Cochran y Mantel-Haenszel.
La mayora de estas pruebas nos permiten comprobar si existe alguna
relacin entre las variable, generando un nmero para representar la fuerza
de la relacin.

Por el momento slo haremos nfasis en el Chi-cuadrado de Pearson, la


cual es la ms utiliza. Esta prueba nos permite determinar si
el comportamiento de las categoras de una variable presentan
diferencias Estadsticamente significativas. Para establecer la diferencia a
travs de SPSS, debemos partir de la teora que no existe relacin entre las
variables de la tabla de contingencia (Hiptesis nula); es decir, debemos
asumir que los resultados de las categoras de una variable no se ven
afectados o influenciados por las categoras de la segunda variable.

El clculo del Chi-cuadrado arroja como resultado un valor numrico


denominado alfa (a), el cual debe ser comparado con el valor terico de
0.05. Cuando el valor calculado es menor que el 0.05 se rachaza la
hiptesis nula, con lo cual podemos concluir que si existe una relacin entre
las variables; por el contrario si el valor calculado es mayor que 0.05 no se
rechaza la hiptesis nula aceptando que no existe ninguna relacin entre las
variables.

A manera de ejemplo vamos a generar la prueba de asociacin del Chi-


cuadrado para las variables Gnero y Estado civil; para lograrlo debemos
volver al cuadro de dilogo y hacer clic en el botn Restablecer de manera
que se retome la configuracin inicial del procedimiento. Una vez se habilita
el cuadro, ubicamos en el listado la variable Estado civil y la ingresamos en
la casilla Filas; sucesivamente ubicamos la variable Gnero y la ingresamos
en la casilla Columnas. A continuacin seleccionamos el botn Estadsticos
y activamos la opcin Chi-cuadrado, haciendo clic sobre la opcin. Para
finalizar hacemos clic en Continuar y luego en Aceptar con lo que
los resultados son creados en el visor [Fig.6-24].

Figura 6-24

Como de costumbre el programa genera la tabla del resumen del


procesamiento y la tabla de contingencia, pero adicionalmente genera una
tercera tabla denominadaPruebas de Chi-cuadrado. En ella aparecen los
valores del Chi-cuadrado y la razn de verosimilitud los cuales son
calculados con base a la diferencia entre las frecuencias observadas y las
esperadas. De todos los valores que se incluyen en latabla, slo hay uno
que realmente nos interesa y es el valor correspondiente a la significacin
asinttica (Bilateral) de la prueba Chi-cuadrado de Pearson; este valor es
el resultado de la prueba y es el que se emplea para realizar la
comparacin.

De acuerdo al resultado podemos concluir que las variables Estado civil y


Gnero si tienen relacin ya que el valor obtenido es menor que [0.05].
Existen tres factores que pueden alterar el resultado de las pruebas de
asociacin e independencia como lo son el tamao de la muestra, la
fidelidad de los datos y el sesgo muestral; antes de sacar alguna conclusin
es necesario revisar estos factores ya que cualquiera de ellos puede
distorsionar severamente el resultado.
Para concluir con las tablas de contingencia vamos a revisar el ltimo botn
de opcin que podemos encontrar en el cuadro de dilogo, el cual
corresponde aExactas (Este botn slo est disponible si se ha instalado el
mdulo de pruebas exactas). Al seleccionar este botn, aparece el cuadro
de dilogo correspondiente [Fig.6-25]; a travs de sus opciones se
proporcionan dos mtodos adicionales paracalcular los niveles de
significacin de los estadsticos disponibles en los procedimientos Tablas de
contingencia y Pruebas no paramtricas. Estos mtodos (el mtodo exacto
y el de Monte Carlo), proporcionan el medio para
obtener resultados exactos cuando los datos no cumplen alguno de los
supuestos subyacentes necesarios para obtener resultados fiables.

Figura 6-25

Las pruebas exactas permiten obtener un nivel de significacin exacto sin


confiar en supuestos que los datos podran no cumplir. Por ejemplo,
los resultados de unexamen de calidad de 20 empaques en una fbrica
muestran que los cinco empaques plsticos superaron la prueba, mientras
que los resultados de los empaques de papel son diversos. Una prueba de
Chi-cuadrado de Pearson, que contrasta la hiptesis nula de que
los resultados son independientes del material, produce un nivel de
significacin asinttico del 0,07. Este resultado lleva a la conclusin de que
los resultados del examen son independientes del material del empaque.

Sin embargo, dado que los datos incluyen slo 20 casos y las casillas tienen
frecuencias esperadas menores que 5, este resultado no es fidedigno. Al
realizar una prueba exacta a la muestra obtenemos que el Chi-cuadrado
de Pearson es de 0,04, lo que conduce a la conclusin contraria. Segn la
significacin exacta, se concluir que los resultados del examen y el
material del empaque estn relacionados. Esto demuestra la importancia de
la obtencin de resultados exactos cuando no se pueden cumplir los
supuestos del mtodo asinttico. La significacin exacta es siempre fiable,
independientemente del tamao, la distribucin, la dispersin o el equilibrio
de los datos.
En conclusin, el procedimiento Tablas de contingencia nos permite
realizar tablasen las que se describan las categoras de una variable a
travs de las categoras de una segunda variable. Para efectuar la
descripcin se pueden emplear diferentes medidas como el recuento, el
porcentaje de fila, el porcentaje de columna o el porcentaje de tabla.
Adicionalmente este procedimiento nos permite generar grficos de barras
con las variables involucradas en la tabla, as como tambin pruebas
estadsticas de independencia como el Chi-cuadrado de Pearson e incluso
generar pruebas estadsticas de precisin como el mtodo de Monte Carlo o
el mtodo Exacto.

Preguntas de Respuesta Multiple con SPSS


Es posible que en algunas ocasiones al momento de recolectar los datos
nos topemos con varias respuestas o mediciones para la misma pregunta, a
este tipo de sucesos se les
denomina Preguntas de Respuesta mltiple. Una de las principales
dificultades que se presentan con este tipo de preguntas radica en la forma
de estructurar las respuestas de manera que toda la informacin pueda ser
empleada en los anlisis.

Generalmente las preguntas de respuesta mltiple se pueden realizar de


dos formas diferentes denominadas Abiertas y Cerradas. Se asume que
una preguntaes abierta, cuando se le permite al
individuo ingresar libremente todas lasrespuestas que considere
convenientes; por ejemplo, si le preguntamos a una persona cuantas
marcas de gaseosas conoce, el individuo nos responder las marcas que
recuerde; en este tipo de preguntas el nmero de respuestas no esta
delimitado y varia de acuerdo a cada entrevistado.

Por el contrario, en las preguntas cerradas se le ofrece al individuo


un listado de opciones de las cuales l puede seleccionar las que considere
pertinentes; para este tipo de preguntas el nmero de respuestas esta
delimitado por el nmero de opciones que el investigador incluya en
el listado.

El Mdulo Base de SPSS nos permite realizar anlisis descriptivos con los
dos tipos de preguntas de respuesta mltiple y generar con ellas tablas de
frecuencia y/o de contingencia. Antes de realizar anlisis mediante SPSS,
es necesarioingresar la informacin recolectada a travs de este tipo
de preguntas en un archivo de datos. Para comprender la forma adecuada
de estructurar los resultados dentro de un archivo de datos de SPSS, vamos
a generar ejemplo apoyndonos en los resultados del sondeo realizado a
cinco personas con las preguntas
Las respuestas de cada uno de los encuestados a estas preguntas se
exponen en las tablas de las figuras [6-26] y [6-27]. Si nos fijamos en los
resultados de la primera pregunta [Fig.6-26], notaremos que cada uno de
los encuestados cuenta con un nmero distinto de respuestas y a su vez las
marcas que cada encuestado menciona son diferentes, lo que nos indica
que es esta pregunta es de tipo Abierta; la principal dificultad de
las preguntas Abiertas radica precisamente en la cantidad de
diferentes respuestas que podemos obtener. Para la
segunda pregunta [Fig.6-27], slo se incluyen las marcas que cada uno de
los encuestados confirmo que conoca; para facilitar la interpretacin,
hemos incluido dentro de la tabla nicamente las letras representativas de
cada marca, por lo que debemos recordar que la letra A equivale a la
marca Mercedes benz, la letra B a Audi, la C a Mazda y as sucesivamente.

Figura 6-26

Figura 6-27

SPSS cuenta con un mtodo especfico para organizar la informacin que


recoge cada uno de los tipos de preguntas de respuesta mltiple. Cuando
se trata de unapregunta Abierta, es necesario ubicar dentro de la totalidad
de los encuestados, el individuo con mayor nmero de respuestas y crear
una variable por cada una de lasrespuesta que haya dado. Por ejemplo, si
nos fijamos en la figura [6-26], notaremos que el tercer individuo cuenta con
el mayor nmero de respuestas (siete diferentes marcas), por lo que
debemos crear siete (7) variables.

Para facilitar la identificacin de las variables que contienen las


diferentesrespuestas de la pregunta, se suele emplear una frase comn
para todas y distinguir el orden por un nmero consecutivo; por ejemplo,
Marca1, Marca2, Marca3,...., Marca7. Una vez se han establecido las
variables, debemos ingresarlos resultados; en la primera variable (Marca1),
ingresamos la primera respuesta(Marca de automvil) que haya dado cada
individuo; en la segunda variable ingresamos la segunda respuesta de cada
individuo y as sucesivamente hasta terminar con las respuestas.

Dado que el nmero de respuestas de cada individuo es diferente, cuando


se terminen las respuestas del individuo debemos dejar en blanco las
casillas de las variables restantes que se encuentren en la fila del sujeto
(Caso). Por ejemplo, para el primer individuo de la figura [6-26], debemos
introducir la respuesta Ford en la variable Marca1, Mazda en Marca2,
Mercedes en Marca3, BMW en Marca4 y Renault en Marca5; para las
variables Marca6 y Marca7 dejamos el espacio en blanco. Si ingresamos
las respuestas de los dems individuos obtenemos la tabla de la figura 6-28.

Figura 6-28

Cuando se trabaja con preguntas de respuesta mltiple de tipo Abierto, es


de gran importancia mantener el orden de las respuestas al momento
de ingresar la informacin al archivo de datos, ya que cuando se
realizan preguntas abiertas la primera respuesta de cada individuo puede
ser empleada para hallar el Top of mine o Marca de mayor recordacin,
cuya teora nos indica que generalmente la primera respuesta corresponde
a la marca que el individuo habitualmente consume.

La otra gran ventaja de las preguntas abiertas radica en la obtencin de


conclusiones ms acertadas ya que las respuestas de cada individuo no se
ven influenciadas por el investigador; generalmente es tipo
de preguntas son empleadas en las encuestas piloto ya que brindan una
orientacin clara sobre los temas que se deben incluir en el estudio.

Preguntas de Respuesta Multiple:


Dicotomicas
Cuando por el contrario se trata de preguntas Cerradas, antes de ingresar la
informacin se debe crear una variable por cada una de las opciones de
respuesta que contenga la encuesta o estudio. Por ejemplo, para
la pregunta Cules de las siguientes marcas de automviles conoce o ha
escuchado mencionar?, se incluyen nueve (9) posibilidades de respuesta,
siendo necesario crear una variable por cada opcin; es decir, nueve (9)
variables en total.

Para el nombre de cada variable se recomienda incluir una frase comn


para todas y distinguirlas con las iniciales de la marca o nombre a la que
corresponde; porejemplo, PGMerce, PGAudi, PGMazda, PGPeug, PGBMW,
PGToyota, PGNissan, PGChevro, PGFord. Debemos recordar que
los nombres de las variables no deben superar los ocho (8) caracteres (64
para la versin 12.0) y que a su vez no debecomenzar con un nmero. En
este tipo de preguntas las respuestas slo toman dos estados o valores (Si
o No, Verdadero o Falso, etc); para ingresar lasrespuestas de cada
individuo se debe colocar un Valor Si en cada una de las variables
(Opciones) que halla seleccionado el encuestado y un Valor No en las que
halla omitido. Despus de ingresar las respuestas de los cinco (5)
encuestados obtenemos los resultados de la figura [6-29].

Figura 6-29

Este tipo de preguntas suelen ser denominadas Dicotomas mltiples dado


que cada una de las opciones es seleccionada o no por parte del
encuestado. Las preguntas cerradas nos ofrecen menor cantidad de
informacin, pero a pesar de esto son ms utilizadas debido a que los
costos de recoleccin, ordenamiento y anlisis son menores comparados
con los de las preguntas abiertas. Desde luego cuando el nmero de
opciones es demasiado elevado, es preferible emplear las preguntas
abiertas.

Una vez se han ingresado todas las respuestas y se han definido todas las
propiedades a cada una de las variables, estamos listos para comenzar con
el anlisis. Antes de realizar cualquier tipo de clculo con los datos, es
necesario definirle al programa los conjuntos de variables que conforman
las respuestas de una pregunta. Para comprender el procedimiento que
conllevan las variables de repuestas mltiples vamos a emplear el contenido
del archivo de datos Multi.savque se anexa en la carpeta Captulo6 del CD
adjunto. Para abrirlo podemos emplear la ruta Archivo... Abrir... Datos, al
activarse la ventana de navegacin, ubicamos el archivo en la unidad de CD
ROM y posteriormente hacemos clic enAbrir.

Despus de abrir el archivo de datos, debemos acceder al procedimiento


derespuestas mltiples por lo que nos dirigimos al men Analizar y
seleccionar la opcin Respuestas mltiples; al seleccionarlo aparece una
sola opcin activa correspondiente a Definir conjuntos, las otras dos
opciones (Frecuencias y Tablas de contingencia), se activan nicamente
cuando se haya definido con antelacin por lo menos un conjunto de
variables.

Al seleccionar la opcin Definir Conjuntos aparece el cuadro de dilogo


correspondiente [Fig.6-30]; a travs de este cuadro se definen las
propiedades del conjunto de variables que contienen las respuestas de
una pregunta Abierta oCerrada. Este cuadro se divide en cinco secciones
entre las que encontramos la lista de variables, la casilla de seleccin, la
definicin del tipo de pregunta, las propiedades del conjunto y la casilla de
conjuntos.

Figura 6-30

Al igual que en la mayora de procedimientos del programa, en la casilla de


seleccin se deben ingresar todas las variables de inters, que para el caso
corresponden a las variables que contienen las respuestas de una
misma pregunta. Las variables que se introduzcan en esta casilla definirn
un conjunto, por lo que es de gran importancia verificar que no se agregue
por error una variable que no contenga respuestas de la misma pregunta, ya
que esto implicara que no cuenta con las mismas propiedades de las
variables de inters (Tipo, Medida, Valores, Perdidos), lo que puede causar
que se presenten problemas al momento de generar las tablas de
frecuencia o de contingencia.

Una vez se han ingresado las variables, es necesario definirle al programa


el tipo de respuestas que contienen. En la seccin Las variables
estn codificadas como, encontramos las opciones Dicotomas y
Categoras. SPSS denomina Dicotomas a las respuestas de
una pregunta cerrada y Categoras a las respuestas de preguntas Abiertas.
Cuando se selecciona la opcin Dicotomas, se activa la casillaValor
contado, en esta casilla se debe ingresar el valor que representa a
lasrespuestas validas (Si, existencia), el cual ser tenido en cuenta para los
clculos. Cuando se selecciona la opcin Categoras se activan las casillas
del rango (Desde, Hasta); en estas casillas se deben ingresar los valores
(Mnimo y Mximo) de los datos.

Despus de especificar la codificacin de las variables, se debe definir el


nombre y la etiqueta del conjunto de datos, ingresando los caracteres en las
respectivas casillas. Para el nombre del conjunto SPSS nos
permite ingresar hasta un mximo de siete (7) caracteres, teniendo en
cuenta no utilizar palabras clave como casenum, sysmis, jdate, date, time,
length y width. Para la etiqueta del conjunto, por el contrario se
puede ingresar hasta un mximo de 40 caracteres.

La ltima seccin que encontramos en el cuadro de dilogo corresponde a


lacasilla de conjuntos, en ella aparecern todos los conjuntos de variables
que hayan sido definidos satisfactoriamente. Para facilitar su identificacin
cada nombre de conjunto esta precediendo con un signo de dlar ($); es
necesario recalcar que el programa no crea una nueva sper-variable en el
editor de datos para guardar toda la informacin del conjunto, sino por el
contrario cuando el nombre del conjunto es empleado en un
procedimiento, SPSS lo sustituye por las variables que lo componen al
momento de realizar los clculos de los estadsticos (Tablas de frecuencia o
Tablas de contingencia).

Para comprender la metodologa empleada en la definicin de los conjuntos


de respuesta mltiple, en la siguiente leccion vamos a generar
algunos ejemplos, empleando las variables de Marca.

Conjuntos de Respuesta Multiple en SPSS


Para comprender la metodologa empleada en la definicin de los conjuntos
de respuesta mltiple, vamos a generar algunos ejemplos, empleando las
variables de Marca (desde Marca1 hasta Marca7) para estipular un conjunto
de respuestascategricas (Abiertas) y las variables PG (PGMerce, PGAudi,
PGMazda, PGPeug, PGBMW, PGToyota, PGNissan, PGChevro, PGFord),
para definir un conjunto derespuestas Dicotmicas (Cerradas). Antes
de comenzar es importante resaltar que a travs de este procedimiento se
puede definir hasta un mximo de 20 conjuntos, con la condicin que cada
uno de ellos cuente con un nombre diferente.

Para definir el primer conjunto debemos ubicar en el listado las variables de


Marca1 hasta Marca7 y sucesivamente ingresarlas en la casilla de
seleccin; posteriormente en la seccin Las variables
estn codificadas como activamos la opcin Categoras. Para ingresar los
valores de los limites del rango (Inferior y Superior) es necesario conocer los
valores que se le han asignado a cada una de las respuestas o categoras;
para facilitar su identificacin, en la tabla de la figura 6-31 se incluyen cada
una de las marcas que aparecen en las respuestas, adicionalmente se
anexa el respectivo valor representativo.
Figura 6-31

Si nos fijamos en los datos de la tabla notaremos que el valor ms bajo


(Mnimo) corresponde al nmero uno (1) y el ms alto (Mximo) al nmero
veintiocho (28); estos valores deben ser ingresados en las casillas de rango.
Una vez estipulado el tipo de respuestas y el rango de los valores
ingresamos en la casilla Nombre la palabra Marcas y en la casilla Etiqueta
la leyenda Marcas de automviles. Despus de definir todas las
propiedades del conjunto debemos obtener los mismos resultados de la
figura 6-32. Para finalizar hacemos clic en el botn Aadircon lo que
aparece en la casilla de conjuntos la variable $Marcas.

Figura 6-32

Una vez se hace clic en el botn Aadir, los parmetros definidos para el
conjunto de variables desaparecen restableciendo la configuracin original
del cuadro. Para definir el segundo conjunto debemos ubicar las variables
PGMerce, PGAudi, PGMazda, PGPeug, PGBMW, PGToyota, PGNissan,
PGChevro, PGFord en la lista de variables e ingresarlas en la casilla de
seleccin; despus de ingresadas seleccionamos en la seccin Las
variables estn codificadas como la opcinDicotomas, al activarse la casilla
valor contado ingresamos el nmero uno (1) el cual corresponde al Si
(Reconoce la marca); sucesivamente en la casilla Nombreingresamos la
palabra Conoce y en la casilla de Etiqueta ingresamos la leyendaMarcas
que reconoce. Despus de definir todas las propiedades del conjunto
obtenemos los resultados de la figura [6-33]. Para finalizar hacemos clic en
Aadir de tal manera que el nombre del conjunto aparezca en la casilla de
conjuntos ($conoce).
Figura 6-33

Una vez aparecen los nombres en la casilla de conjuntos, podemos terminar


la definicin haciendo clic en el botn Cerrar. Es necesario recalcar que las
declaraciones de conjuntos de respuesta mltiple estarn disponibles
solamente el tiempo que dure abierta la sesin, hasta que se abra
otro archivo de datos o salga de SPSS. Los conjuntos no son conservados a
travs de las distintas sesiones deSPSS, ni almacenados en el editor de
datos. (Este inconveniente quedo solucionado para las ultimas versiones
de SPSS por lo que los conjuntos son guardados con
el archivo o ficheros de datos).

Frecuencias Conjuntos de Respuesta


Multiple
El mdulo Base de SPSS nos ofrece dos procedimientos para el anlisis
descriptivo de las preguntas de respuesta mltiple (Frecuencias y Tablas
decontingencia); para acceder a estos procedimientos debemos ir al
men Analizar y seleccionar el submen Respuestas mltiples [Fig.6-34]; al
desplegarse las opciones aparecen activos los procedimientos descriptivos,
esto se debe a que ya se ha definido por lo menos un conjunto de variables.
Para continuar con la exploracin de estos procedimientos seleccionamos la
opcin Frecuencias con lo que aparecer el cuadro de dilogo
correspondiente [Fig.6-35].
Figuras 6-34 y 6-35

Este cuadro se encuentra dividido en tres secciones (Lista de


conjuntos, casilla de seleccin y Valores perdidos). En la lista de conjuntos
slo aparecen los nombresde los conjuntos que se hayan definido con
antelacin. En la casilla de seleccin se deben ingresar los conjuntos a los
que se desea realizar el anlisis descriptivo (Tabla de frecuencias).

En la ltima seccin (Valores perdidos) encontramos las opciones para


limitar el nmero de casos que sern tenidos en cuenta para los clculos,
cuando se selecciona la opcin Excluir los casos segn lista dentro de las
dicotomas elprograma omitir de los clculos los casos que en la totalidad
de las variables no tenga un valor positivo (Valor contado); es decir, excluye
los casos en que aparezca una respuesta o valor diferente al nmero que se
haya definido como valor contado dentro de los parmetros del conjunto;
esta opcin se suele emplear cuando se requiere una repuesta positiva en
la totalidad de las preguntas.

La segunda opcin corresponde a Excluir los casos segn lista dentro de las
categoras, al seleccionarla el programa omite los casos en los que
encuentra en alguna de las variables un valor fuera del rango establecido.
Adems de las opciones de esta seccin, el programa tambin omite los
casos en los que no se encuentre un valor valido dentro de la totalidad de
las variables (Valor contado en Dicotomas o un valor del rango en
Categoras).

A manera de ejemplo vamos a generar las tablas de frecuencia para los


conjuntos ($Marcas y $Conoce), por lo que debemos seleccionarlos e
ingresarlos en la casilla de seleccin; por el momento no emplearemos las
opciones de limitacin de casos as que hacemos clic en Aceptar de manera
que las tablas son creadas en el visor de resultados de SPSS [Fig.6-36].
Figura 6-36

El procedimiento Frecuencias para los conjuntos de variables de respuesta


mltiple, genera tablas en formato de texto, en las que se incluyen los
estadsticos Recuento (Count), Porcentaje de respuestas (Pct of
Responses), Porcentaje de casos (Pct of cases), Nmero de casos perdidos
(Missing cases) y Nmero de casos validos (Valid cases). Para los
conjuntos de categoras, los nombres de cada categora provienen de las
etiquetas de valor que se hayan definido para la primera variable del
conjunto (Columna Valores en la vista de variables).

Para los conjuntos de dicotomas mltiples, los nombres de las categoras


que se muestran en los resultados provienen de las etiquetas que se hayan
definido para cada variable que compone el conjunto. Para facilitar la
identificacin del tipo depregunta (Dicotoma o Categrica) se incluye dentro
de cada tabla una leyenda en la parte superior izquierda, que nos informa el
tipo de conjunto; adems, cuando se trata de un conjunto de dicotomas
mltiples se incluye una leyenda con el valor contado (Value Tabulated).

Si nos fijamos en los resultados de las tablas de frecuencia de la figura [6-


36], notaremos que el recuento (Count) y el porcentaje de casos (Ptc of
cases) cuentan con cifras bastante altas, esto se debe a que cada
encuestado tiene la posibilidad de dar hasta nueve (9) respuestas para las
preguntas de Dicotomas y hasta siete (7) respuestas para las preguntas
Categricas. Una de las principales dificultades de este tipo de tablas radica
en la interpretacin de los porcentajes; si observamos los resultados del
porcentaje de casos para la marca Mercedes Benz en las dos tablas
(Dicotomas y Categricas) notaremos una amplia diferencia porcentual
entre ellas, a pesar que el objetivo de los dos tipos de preguntas es
identificar la aceptacin o reconocimiento de las marcas en los
encuestados.

Generalmente las preguntas de Dicotomas mltiples (Cerradas) tienden a


mostrar porcentajes ms altos debido a que el entrevistado puede ser
influenciado a recordar la marca que se le pregunta, este fenmeno no se
presenta en las preguntas categricas (Abiertas) ya que no existe ningn
tipo de leyenda o frase que pueda influenciar las respuestas.

Sin importar que tipo de pregunta sea, las conclusiones deben ser obtenidas
deacuerdo al porcentaje de casos; por ejemplo, si asumimos que el objetivo
de las dos preguntas es identificar el reconocimiento de las marcas en el
mercado, de latabla de Dicotomas mltiples concluiramos que el 75.0% de
los encuestados reconocen la marca de automviles Mercedes Benz,
mientras que de la tabla de Categricas concluiramos que el 25.8% de los
encuestados reconoce la marca de automviles Mercedes Benz.

Por otro lado, el porcentaje de respuestas nos indica la porcin o fraccin


derespuestas que se puede esperar si se realizan estas mismas preguntas
a otro grupo de personas, dando una orientacin sobre las tendencias de
las respuestas; este porcentaje no se debe tomar como una conclusin del
reconocimiento de cada marca por parte de los encuestados, sino como un
parmetro informativo para futuras encuestas.
A pesar que las preguntas abiertas suelen ser ms confiables y precisas, no
se emplean con regularidad, debido principalmente a los altos costos que
implican su recoleccin, organizacin y anlisis. Para finalizar con este
procedimiento es necesario resaltar que los resultados de este ejemplo no
son representativos del mercado ya que los datos que se incluyen en el
archivo han sido manipulados a voluntad del autor, para facilitar la
interpretacin de los efectos del procedimiento.

Tablas Cruzadas - Conjuntos Respuesta


Multiple
El segundo procedimiento con que cuenta SPSS para el anlisis descriptivo
de las preguntas de respuesta mltiple corresponde a las tablas de
contingencia. A travs de este procedimiento se puede describir
las respuestas del conjunto de acuerdo a las categoras de una o varias
variables, as como tambin se puede crear unatabla de contingencia con
dos o ms conjuntos de respuesta mltiple.

Para generar una tabla de contingencia con conjuntos de variables,


debemos ir al men Analizar, activar el submen Respuestas mltiples y
seleccionar la opcinTablas de contingencia; al hacer clic en esta opcin
aparece el cuadro de dilogo correspondiente [Fig.6-37]. Este cuadro se
encuentra dividido en cuatro secciones (Lista de variables, Lista de
conjuntos, Casillas de seleccin y Botones de opcin), a travs de estas
secciones se definen las caractersticas estructurales de la tabla de
contingencia.

Figura 6-37

Al igual que en la mayora de los cuadros de dialogo de los diferentes


procedimientos del programa, en la lista de variables aparecen todas las
variables con que cuenta el archivo de datos. Por el contrario, en la lista de
conjuntos aparecen slo los conjuntos de variables que se hayan definido
durante la sesin de trabajo. La tercera seccin corresponde a las casillas
de seleccin, en ella encontramos las casillas filas, columnas y capa; las
variables que se ingresen en cada una de las casillas de dimensin (Fila,
Columna o Capa) definirn las categoras de cada una de las dimensiones.

Por ltimo encontramos la seccin Botones de opcin, en donde


encontramos el botn Definir rangos, el cual se emplea para especificar las
categoras de la variable que sern incluidas en la tabla; mientras que en el
botn Opcionesaparecen las posibilidades de los estadsticos y los valores
perdidos.

Para comprender la metodologa empleada en la definicin de las


propiedades de las tablas de contingencia para las preguntas de respuesta
mltiple vamos a generar un ejemplo con el conjunto de
dicotomas $Conoce y la variable Gnero del encuestado.

Para realizarlo, vamos a ingresar en la casilla Filas el conjunto $Conoce, por


lo que lo seleccionamos en la lista de conjuntos y sucesivamente hacemos
clic en el botn Flecha ( ) ubicado al costado izquierdo de la respectiva
casilla de dimensin (Filas), a continuacin ingresamos la variable Gnero
en la casilla columnas; note como una vez que es ingresada la variable en
la casilla de columnas aparece a su lado dos signos de interrogacin entre
parntesis (??), esto se debe a que el programa requiere que se le estipule
las categoras que se desean incluir en latabla. Para realizarlo debemos
hacer clic en el botn Definir rangos con lo que aparece el cuadro de
dilogo correspondiente [Fig.6-38]; en este cuadro se encuentran las
casillas Mnimo y Mximo, a travs de las cuales se define el rango de las
categoras de la variable gnero que sern incluidas en la tabla.

Figura 6-38

Si no se conoce o no se recuerda los valores de las categoras de inters de


una variable, SPSS nos ofrece la oportunidad de obtener informacin de ella
sin salir del procedimiento. Para acceder a esta informacin es necesario
volver al cuadro principal y hacer clic derecho sobre la variable de inters de
manera que surja el men desplegable y sucesivamente elegir la
opcin Informacin de las variablescon lo que aparece el cuadro de dilogo
correspondiente [Fig.6-39], en este cuadro se incluye el Nombre, la etiqueta,
la Medida y las Etiquetas de valor de la variable seleccionada.
Para continuar con el ejemplo, seleccionaremos nuevamente el botnDefinir
rangos e ingresamos en la casilla Mnimo el nmero 1 y en la
casillaMximo el nmero 2, para finalizar hacemos clic en el
botn Continuar con lo que los valores (Nmeros) aparecen dentro del
parntesis de la variable Gnero.

Figura 6-39

Despus de definir los valores de la variable Gnero que sern incluidos en


la tabla de contingencia, debemos estipular los estadsticos
del procedimiento. En la siguiente leccin aprendemos como definir los
estadsticos de las tablas de Contingencia con Conjuntos de variables de
Respuesta mltiple.

Estadisticos: Tablas Cruzadas - Conjuntos


Despus de definir los valores de la variable Gnero que sern incluidos en
la tablade contingencia, debemos estipular los estadsticos
del procedimiento. Para realizarlo debemos hacer clic en el
botn Opciones con lo que aparece el cuadro de dilogo correspondiente
[Fig.6-40]. A travs de este cuadro podemos pedirle alprocedimiento que
incluya los porcentajes de Fila, Columna y Total; estos porcentajes son
calculados de la misma manera que se especifico en los apartados
anteriores.

Figura 6-40

Adems de los porcentajes, el procedimiento tambin nos ofrece otras


opciones como Emparejar las variables entre los conjuntos de respuesta; al
activar esta opcin el programa empareja la primera variable del primer
grupo con la primera variable del segundo grupo, la segunda variable del
primer grupo con la segunda variable del segundo grupo, y as
sucesivamente. Desde luego esta opcin slo es aplicable cuando se
genera una tabla de contingencia con conjuntos de preguntas
de respuesta mltiple Categricas y los porcentajes de las casillas se
deducen a partir de las respuestas en lugar de obtenerlos a partir de los
casos (los entrevistados).

La tercera opcin de este cuadro corresponde a Porcentajes basados en; a


travs de estas opciones se define si los estadsticos (porcentajes) que se
incluyen en latabla estarn basados en el nmero de casos (Entrevistados)
o el nmero derespuestas; estas opciones corresponden al porcentaje de
casos y el porcentaje derespuestas que aparecen en las tablas de
frecuencia de las variables de respuestamltiple. La ultima opcin que
encontramos corresponde a los valores perdidos y cuentan con las mismas
caractersticas que en las tablas de Frecuencia derespuesta mltiple
(Discutidas anteriormente).

Continuando con el ejemplo seleccionaremos la opcin Porcentaje de


columna y en la seccin Porcentajes basados en, la opcin Casos; para
finalizar hacemos clic en el botn Continuar, con lo que volveremos al
cuadro de dilogo principal. Para finalizar el procedimiento hacemos clic
en Aceptar con lo que la tabla es creada en visor de resultados
de SPSS [Fig.6-41].
Figura 6-41

De igual manera que en las tablas de frecuencia, los resultados de


las tablas de contingencia para preguntas de respuesta mltiple se generan
en formato de texto, en donde se incluyen las etiquetas y los nombres de las
variables de cada dimensin (Fila y Columna). As mismo, los valores de
cada casilla corresponden a una combinacin especfica entre las
categoras de las variables de las dos dimensiones (Fila y Columna).

Para la interpretacin de los valores de cada casilla se debe realizar el


mismoprocedimiento que se explico para las tablas de contingencia de
variables convencionales; por ejemplo, para interpretar el porcentaje de la
primera casilla de la tabla, debemos leer primero el valor (80.7%),
sucesivamente la categora de la variable de la columna (Femenino) y
concluir sobre la categora de la fila (Mercedes Benz); ordenando la oracin
obtendramos que el 80.7% de las mujeres reconocen la marca de
automviles Mercedes Benz.

Si nos fijamos en los resultados de la tabla notaremos que los valores que
aparecen en la columna Total de Fila (Row total), corresponden a los
valores del recuento (Count) y porcentaje de casos (Pct of cases) obtenidos
para el conjunto de variables de dicotomas a travs
del procedimiento Frecuencias.

Las tablas de contingencia para variables de respuesta mltiple, no nos


permiten generar pruebas estadsticas de Asociacin/independencia como
el Chi-cuadrado o las correlaciones, debido en gran medida a que estas
pruebas no son aplicables a este tipo de variables. Antes de finalizar es
necesario recalcar que los estadsticos (Porcentajes de resumen) que sean
empleados en las tablas de contingencia deben ser elegidos teniendo como
prioridad la utilidad que proporcionen a la explicacin
del comportamiento de la preguntas de respuestamltiple, por lo que es
aconsejable emplear en la mayora de las ocasiones el porcentaje de casos.

En conclusin, el procedimiento Conjuntos de respuesta mltiple nos


permite generar tablas de frecuencia y/o tablas de contingencia para grupos
de variables que contengan las respuestas de un grupo de individuos a una
pregunta de mltiple seleccin. La principal ventaja de este tipo de variables
es la gran cantidad de informacin que le proporciona al investigador, ya
que ofrece la posibilidad de determinar de forma precisa los gustos o
tendencias de los encuestados, permitindoles elegir entre un elevado
nmero de opciones.
Figura 6-41

De igual manera que en las tablas de frecuencia, los resultados de las


tablas de contingencia para preguntas de respuesta mltiple se generan en
formato de texto, en donde se incluyen las etiquetas y los nombres de las
variables de cada dimensin (Fila y Columna). As mismo, los valores de
cada casilla corresponden a una combinacin especfica entre las
categoras de las variables de las dos dimensiones (Fila y Columna).

Para la interpretacin de los valores de cada casilla se debe realizar el


mismoprocedimiento que se explico para las tablas de contingencia de
variables convencionales; por ejemplo, para interpretar el porcentaje de la
primera casilla de la tabla, debemos leer primero el valor (80.7%),
sucesivamente la categora de la variable de la columna (Femenino) y
concluir sobre la categora de la fila (Mercedes Benz); ordenando la oracin
obtendramos que el 80.7% de las mujeres reconocen la marca de
automviles Mercedes Benz.

Si nos fijamos en los resultados de la tabla notaremos que los valores que
aparecen en la columna Total de Fila (Row total), corresponden a los
valores del recuento (Count) y porcentaje de casos (Pct of cases) obtenidos
para el conjunto de variables de dicotomas a travs
del procedimiento Frecuencias.

Las tablas de contingencia para variables de respuesta mltiple, no nos


permiten generar pruebas estadsticas de Asociacin/independencia como
el Chi-cuadrado o las correlaciones, debido en gran medida a que estas
pruebas no son aplicables a este tipo de variables. Antes de finalizar es
necesario recalcar que los estadsticos (Porcentajes de resumen) que sean
empleados en las tablas de contingencia deben ser elegidos teniendo como
prioridad la utilidad que proporcionen a la explicacin
del comportamiento de la preguntas de respuestamltiple, por lo que es
aconsejable emplear en la mayora de las ocasiones el porcentaje de casos.

En conclusin, el procedimiento Conjuntos de respuesta mltiple nos


permite generar tablas de frecuencia y/o tablas de contingencia para grupos
de variables que contengan las respuestas de un grupo de individuos a
una pregunta de mltiple seleccin. La principal ventaja de este tipo de
variables es la gran cantidad de informacin que le proporciona al
investigador, ya que ofrece la posibilidad de determinar de forma precisa los
gustos o tendencias de los encuestados, permitindoles elegir entre un
elevado nmero de opciones.

Cubos OLAP en SPSS


El procedimiento Cubos OLAP (siglas en ingles de On-Line Analytic
Processing, Procesamiento Analtico Interactivo) es uno de los mtodos
ms empleados en la exploracin de datos. A travs de los Cubos OLAP se
puede observar el comportamiento de los datos de varias variables
de escala de a cuerdo a una combinacin especfica de categoras de
mltiples variables categricas.

La utilidad de este procedimiento radica en la capacidad de actualizar la


tabla deresultados a medida que se va modificando la combinacin de
categoras, sin necesidad de redefinirlas en el cuadro de dilogo del
procedimiento. Para el anlisis de las variables de escala el programa
cuenta con una serie de medidas estadsticas como la media, la mediana o
la desviacin estndar, a su vez para las variables categricas el
procedimiento genera listas desplegables en las que se incluye cada una de
las categoras de la variable, as como la opcin total.

Para comprender la metodologa empleada en la definicin y creacin de los


cubos OLAP, vamos a generar un ejemplo con los datos contenidos en el
archivoCubos.sav incluido en la carpeta Captulo6 del CD adjunto. Antes de
iniciar con el procedimiento, es necesario contar con el archivo de datos
abierto en el editor deSPSS, por lo que debemos abrirlo a travs de la
ruta Archivo.. Abrir.. Datos. Una vez cargado el archivo, estamos listos para
la generacin del ejemplo. Para acceder al procedimiento, debemos ir al
men Analizar... Informes... Cubos OLAP; al seleccionarlo aparece el
cuadro de dilogo correspondiente [Fig.6-42]. Este cuadro se encuentra
dividido en tres secciones definidas como la Lista de variables, las Casillas
de seleccin y los Botones de opcin.

Figura 6-42

Dentro de la seccin casillas de seleccin se definen las variables que


harn parte del procedimiento. En la casilla de resumen (Variables de
resumen), se debeningresar las variables de escala que sern empleadas
en el cubo; el contenido de estas variables se resume a travs de los
diferentes estadsticos que se seleccionen; si por algn motivo se ingresa
una variable categrica en esta casilla, el programa asume que es
de escala y le realiza los clculos de los estadsticos deresumen.

En la casilla Agrupacin, se deben ingresar las variables categricas que


definirn los subgrupos de datos que sern descritos a travs de
los resultados de los estadsticos de resumen de las variables de escala; si
por algn motivo se ingresa una variable de escala en esta casilla, el
programa asume que cada valor de la variable corresponde a una categora.

Para comprender mejor el funcionamiento vamos a generar un Cubo OLAP


con las variables Edad del entrevistado (Escala) y Gnero (Categrica).
Para realizarlo, debemos ingresar la variable Edad del entrevistado en la
casilla Resumen y la variable Gnero la ingresamos en la
casilla Agrupacin; para finalizar hacemos clicen Aceptar con lo que el cubo
ser creado en el visor de resultados de SPSS[Fig.6-43].
Figura 6-43

Para poder observar los resultados de las diferentes categoras de la


variable gnero, es necesario activar el Cubo haciendo doble clic en l, de
manera que aparezca al lado de la variable Gnero la lista desplegable de
las categoras [Fig.6-44]. Al hacer clic sobre el icono de la lista ( ),
aparecen todas las categoras de la variable que para el caso corresponden
a Femenino, Masculino y Total, para seleccionar alguna de ellas basta con
hacer clic sobre la categora deseada, con lo cual los resultados de la tabla
cambiarn y harn referencia exclusivamente a los casos de la categora
seleccionada.

Figura 6-44

Si seleccionamos la categora Femenino obtendremos los valores de la


figura [6-45]. Si nos fijamos en los resultados notaremos que todos los
valores han cambiado y ahora hacen referencia nicamente a los casos de
la categora Femenino. A partir de estas respuestas podemos deducir que
en el archivo de datos hay un total de 154 mujeres, con un promedio de
edad de 31.82 32 aos, con una desviacin tpica de 7.066 y que a su vez
conforman el 51.3% de lasrespuestas validas.

Figura 6-45
De igual manera ocurre si seleccionamos la categora Masculino, en cuyo
caso los valores de cada casilla cambiaran expresando el comportamiento
de la edad para los hombres. Para realizar los clculos de los estadsticos
de resumen de las variables de escala, el programa toma exclusivamente
los casos que correspondan a la categora que se haya seleccionado. Para
desactivar el Cubo basta con hacerclic fuera del rea de la tabla.

Desde luego esta es la aplicacin ms sencilla que se puede realizar con un


Cubo OLAP, ya que slo vincula una variable de escala (Resumen) y una
variable categrica (Agrupacin). En las siguientes lecciones
haremos ejemplos de Cubos OLAP mas complejos.

Estadisticos en los Cubos OLAP de SPSS


En algunas ocasiones los estadsticos de resumen que
el procedimiento emplea por defecto no son realmente tiles, ya sea por el
objetivo del anlisis o por la naturaleza de los datos. Por ejemplo, si nos
fijamos en el estadstico Suma generado en el ejercicio anterior, notaremos
que nos da como resultado 4900, lo que nos indicara el total de aos que
acumulan las mujeres de la encuesta; por mltiples motivos este valor no es
de utilidad dada la naturaleza de los datos, sin embargo si se tratase de los
ingresos o las ventas de las mujeres si tendra una aplicacin ms
apropiada.

Para modificar estos parmetros debemos volver al cuadro de dilogo, ya


sea mediante la ruta Analizar.. Informes.. Cubos OLAP por medio del
botnRecuperar cuadro de dilogo ( ). La segunda seccin del cuadro de
dilogo corresponde a los Botones de opcin, a travs de ellos se puede
definir diferentes parmetros del procedimiento como los estadsticos
de resumen, las diferencias entre grupos o variables y los ttulos de los
resultados. Es necesario resaltar que el botn Estadsticos slo se activa
cuando se han ingresado variables a las casillas de seleccin
(Resumen y Agrupacin). Al seleccionar el botn Estadsticos, aparece el
cuadro de dilogo correspondiente [Fig.6-46].
Figura 6-46

A travs de este cuadro podemos definir los estadsticos de resumen que


sern incluidos en el Cubo; dentro del cuadro encontramos dos casillas, la
primera corresponde a la Lista de estadsticos y la segunda a la casilla de
seleccin (Estadsticos de casilla).

El procedimiento Cubos OLAP, nos ofrece una gran variedad de


estadsticos deresumen entre los que encontramos la Suma, Nmero de
casos, Media, Mediana, Mediana agrupada, Error tpico de la media,
Mnimo, Mximo, Rango, Valor de la variable para la primera categora de la
variable de agrupacin, Valor de la variable para la ltima categora de la
variable de agrupacin, Desviacin tpica, Varianza, Curtosis, Error tpico de
Curtosis, Asimetra, Error tpico de asimetra, Porcentaje de casos totales,
Porcentaje de la suma total, Porcentaje de casos totales dentro de las
variables de agrupacin, Porcentaje de la suma total dentro de las variables
de agrupacin, Media geomtrica y Media armnica.

Todos los estadsticos de resumen que se seleccionen mantendrn en los


resultados el mismo orden al que aparece en la casilla de seleccin.
Par ingresaruna estadstico se debe resaltar en la lista haciendo clic sobre
l y posteriormente hacer clic en el botn flecha ( )
simplemente haciendo doble clic sobre el estadstico de inters.

Por el momento no seleccionaremos ninguno por lo cual hacemos clic en el


botnContinuar. El segundo botn de opcin que encontramos corresponde
aDiferencias, al seleccionarlo aparece el cuadro de dilogo correspondiente
[Fig.6-47]; este cuadro se encuentra dividido en cuatro secciones
correspondientes a Diferencias para estadsticos de resumen, Tipo de
diferencia, Diferencias entre variables y Diferencias entre grupos de casos.
Mediante estas secciones podemos especificarle al programa que realice
comparaciones de porcentaje o aritmticas entre las variables de resumen o
entre las categoras de una variable.
Figura 6-43

Mediante la seccin Diferencias para estadsticos de resumen se define la


clase de comparacin que se realizar en el Cubo; en esta seccin
encontramos las opciones Ninguna, Diferencias entre
variables y Diferencias entre grupos de casos. Para que la opcin
diferencias entre variables se active es necesarioingresar en la casilla
de Resumen dos o ms variables de escala y para activar la opcin
Diferencias entre grupos de casos se deben ingresar una o ms variables
categricas en la casilla de agrupacin. Al seleccionar alguna de estas dos
opciones (Diferencias), se activa la seccin correspondiente, habilitando
cada una de las casillas de definicin que contienen.

La segunda parte de este cuadro de dilogo corresponde al Tipo de


diferencia, a travs de ella podemos especificarle al programa que tipo de
comparacin se realizar eligiendo alguna de las opciones de porcentaje
(Calcula la diferencia porcentual) o aritmtica (Calcula la diferencia
aritmtica entre las medidas) o ambas si se desea.

Para comprender mejor el funcionamiento de las secciones de este cuadro


de dilogo, en las siguientes lecciones vamos a generar
algunos ejemplos tratando de involucrar la mayor cantidad de opciones
posibles.

Diferencias: Cubos OLAP en SPSS


Para el primer ejemplo debemos volver al cuadro de dilogo principal, por lo
que hacemos clic en el botn Continuar; una vez volvemos al cuadro
principal, hacemos clic en el botn Restablecer con el fin de retomar la
configuracin inicial delprocedimiento. Despus de reiniciaiar el cuadro,
ubicamos en la lista las variables Aos totales estudiados (Educaos), Edad
del entrevistado (Edad), Ingresos e ingresos anuales (Inganual) y las
ingresamos en la casilla de resumen, de igual manera ubicamos las
variables Gnero y Estado civil y la ingresamos en la casilla de agrupacin.

Una vez ingresadas las variables en sus respectivas casilla


debemos obtener los resultados de la figura [6-48]; sucesivamente
activamos el botn de estadsticos y eliminamos de la casilla de seleccin
las los estadsticos Suma y Porcentaje total de la suma, e ingresamos la
Mediana [Fig.6-49]; para finalizar hacemos clic enContinuar y luego
en Aceptar con lo que el Cubo se crea en el visor de resultados
de SPSS [Fig.6-50].

Figuras 6-48 y 6-49

Figura 6-50

Como de costumbre el programa genera primero la tabla del resumen del


procesamiento de casos, en la que incluye los recuentos para los valores
validos y perdidos de cada una de las variables de escala (Resumen) que
se hayan involucrado en el procedimiento. Si nos fijamos en los resultados
de esta tabla, notaremos que para los clculos de las variables Edad en
aos se tuvieron en cuenta 300 casos, mientras que para la variable Aos
estudiados (Educaos) slo se tuvieran en cuenta 296 casos y para las
variables Ingresos mensuales e Ingresos anuales (Inganual) se tomaron 298
casos respectivamente.

La segunda tabla corresponde directamente al Cubo OLAP; en ella tambin


se incluyen los recuentos y sus respectivos porcentajes. Si comparamos los
valores porcentuales de las dos tablas notaremos que son diferentes,
debido a que los porcentajes de la tabla de resumen representan la porcin
de los casos del archivo que se incluyeron en el procedimiento, mientras los
porcentajes del Cubo corresponden al total de casos validos del cruce de
las variables categricas con cada variable de escala.

Para poder acceder al cubo es necesario hacer doble clic sobre l, con lo
que cada una de sus opciones se activar [Fig.6-51]. Si observamos las
columnas de la tablanotaremos que han desaparecido los estadsticos
(Suma y Porcentaje de suma) y en su lugar aparece la mediana. Es
necesario resaltar que los valores de los estadsticos de cada una de las
variables de escala son calculados por separado basado en las condiciones
(Categoras) de las variables de Agrupacin.

Figura 6-51

Por el momento no entraremos a realizar el anlisis de los datos y nos


enfocaremos en las opciones del botn Diferencias. En la siguiente leccion
le pediremos al programa que incluya diferencias entre las variables para
exponer los efectos de esta opcion.

Diferencias: Variables de Escala - Cubos


OLAP
Para comprender las opciones del botn Diferencias es necesario que nos
fijemos en las posibilidades de cada una de las listas desplegables de las
variables de agrupacin [Fig.6-52], ya que los resultados de las diferencias
entre categoras de una variable aparecen dentro de ellos. Si observamos
los listados, notaremos que cuentan con las categoras de cada variable y
adicionalmente se anexa la categora Total; despus de realizar
el ejemplo compararemos los listados con el fin de hacer notar los cambios.

Figura 6-52

Los resultados de cada una de las combinaciones de las categoras de las


variables de agrupacin sern explorados ms adelante, por el momento
nos concentraremos en generar comparaciones entre las variables
de escala y entre las categoras de una variable de agrupacin. Para
realizarlo debemos desactivar el Cubo haciendo clic fuera del rea de
seleccin y posteriormente debemos volver al cuadro de dilogo del
procedimiento ya sea a travs del botn Recuperar cuadro de dilogo ( ) o
mediante la ruta Analizar.. Informes.. Cubos OLAP.

Una vez aparece el cuadro hacemos clic en el botn Diferencias con lo cual
se activa el cuadro correspondiente. Dado que existen cuatro variables
de escala en la casilla de resumen la opcin Diferencias entre variables se
encuentra disponible; al seleccionar esta opcin la seccin Diferencias entre
variables se activa, debemos observar que la ultima casilla de esta seccin
se encuentra aun deshabilitada debido a que en la Seccin tipo de
diferencia slo se encuentra seleccionada la opcin diferencia porcentual, al
activar la opcin diferencia aritmtica se activa la casilla Etiqueta
aritmtica [Fig.6-53].

Figura 6-51
Despus de activar los dos tipos de diferencias debemos definir las
variables que sern comparadas, para lo cual nos dirigimos a la
casilla variable de la seccinDiferencias entre variables y por medio del
botn desplegable ( ) ubicamos la variable Ingresos anuales (Inganual);
posteriormente, en la casilla Menos variableseleccionamos la variable
Ingresos mensuales (Ingrsos).

A continuacin introducimos en la etiqueta de porcentaje la


leyenda Diferencia porcentual entre los ingresos y en la casilla etiqueta
aritmtica la leyendaDiferencia aritmtica entre los ingresos. Una vez
especificadas cada una de las casillas, hacemos clic en el botn flecha ( )
con lo que la diferencia queda definida en la casilla Pares [Fig.6-54]. Para
finalizar hacemos clic en el botn Continuar y luego en Aceptar con lo que
los resultados son expuestos en el visor [Fig.6-55]. Si nos fijamos en los
resultados notaremos que ahora aparecen dos nuevas filas
correspondientes a la diferencia porcentual y la diferencia aritmtica entre
las variables Ingresos anuales y la variable Ingresos mensuales.

Figura 6-55

Cada una de las casillas de estas filas contiene la diferencia aritmtica o


porcentual que existe entre los valores de las dos variables. Para hallar la
diferencia aritmtica el programa toma el valor de la primera variable
(Inganual) y le resta el valor de la segunda variable (Ingresos); mientras que
para la diferencia porcentual toma elresultado de la diferencia aritmtica y lo
divide por el valor de la casilla de la segunda variable (Ingresos) y
el resultado se multiplica por el 100 %.

La diferencia entre variables de escala es de gran utilidad cuando


trabajamos con variables como las ventas, ya que nos permite determinar
las variaciones entre dos grupos de ventas. El programa nos permite definir
varios grupos de variables siempre y cuando las variables tengan la misma
dimensin; es decir, no debemos definir variables que no estn relacionadas
como la edad y los ingresos ya que la primera se expresa en aos y la
segunda representa cantidades de dinero (en este caso dlares). El nmero
mximo de diferencias esta limitado por el nmero de variables
de escala que se hayan definido para el procedimiento.

El programa no permite que las diferencias entre variables sean empleadas


al mismo tiempo que las diferencias entre categoras de una variable, por
este motivo si desplegamos las listas de categoras de cada variable no
aparecern ninguna diferencia. En la siguiente leccion conoceremos la
forma de crear una diferencia entre las categorias de una variable de
agrupacin.

Diferencias: Variables Categoricas - Cubos


OLAP
Para crear una comparacin entre las categoras de una variable debemos
volver al cuadro de dilogo y seleccionar el botn Diferencias con lo que
aparecer el cuadro correspondiente. Antes de definir las categoras y la
variable debemos seleccionar en la seccin Diferencias entre estadsticos
de resumen la opcinDiferencias entre grupos de variables con lo que se
activaran las casillas de la seccin correspondiente.

En la casilla variable debemos elegir de la lista desplegable la variable


Gnero; a continuacin introducimos en la casilla categora el nmero que
representa a la categora que deseamos vincular, este valor se
debi estipular con anterioridad en la vista de variables, para el ejemplo este
valor corresponde al nmero 1 que representa la categora Femenino,
sucesivamente en la casilla Menos categoraingresamos el valor 2 que
identifica la categora Masculino; en la casilla etiqueta de porcentaje
ingresamos la leyenda Diferencia porcentual y en la etiqueta aritmtica la
leyenda Diferencia aritmtica. Una vez hemos definido cada una de las
casillas satisfactoriamente hacemos clic en el botn flecha con lo que la
comparacin queda declarada en la casilla pares [Fig.6-56].
Figura 6-56

Es necesario aclarar que a pesar que las dos diferencias se encuentran


declaradas en el mismo cuadro de dilogo, el programa slo realiza la
comparacin que coincida con la opcin seleccionada en la
seccin Diferencias para estadsticos deresumen omitiendo la otra; es decir,
el programa slo realiza la comparacin correspondiente a la opcin que se
encuentre seleccionada en la seccin Diferencia para estadsticos de
resumen al momento de hacer clic en el botnContinuar. Para terminar
hacemos clic en Continuar y luego en Aceptar con lo que los resultados son
creados en el visor de SPSS [Fig.6-57].

Figura 6-57

A simple vista es imperceptible notar los resultados de este procedimiento,


para poderlos observar debemos activar el cubo y seleccionar
la lista desplegable de la variable Gnero, en donde encontraremos dos
nuevas opciones denominadasDiferencia porcentual y Diferencia aritmtica.
Al seleccionar la diferencia porcentual, los resultados de cada casilla de
la tabla cambiaran enseando valores porcentuales [Fig.6-58]; si nos
fijamos en los resultados notaremos que algunos de estos valores cuentan
con signo negativo, lo que nos indica que en esa casilla elresultado del
Gnero Masculino es mayor que el Gnero Femenino. Cada uno de los
valores de casilla representa la diferencia porcentual de los resultados de
los Gneros y el signo nos indica cual de ellos es mayor.

Figura 6-58

Ahora si seleccionamos la opcin Diferencia aritmtica los valores de cada


casilla representarn la diferencia numrica de los Gneros obteniendo los
resultados de la figura [6-59].

Figura 6-59

Es necesario recalcar que para estos valores los signos cuentan con la
misma utilidad (El signo positivo representan que el gnero femenino es
mayor que el masculino y el signo negativo representa el sentido contrario)
y a su vez los valores representan la diferencia que existe entre los dos
gneros, es decir, si por ejemploobservamos la Media de la edad del
entrevistado, este valor nos indicara que los hombres cuentan con un
promedio de edad ms alto que el de las mujeres y su diferencia es de 1.6
Aos en promedio.

Para observar los valores de cada Gnero (Masculino o Femenino)


debemos seleccionarlo en la lista desplegable, con lo cual los valores de
la tablarepresentarn el comportamiento de sus datos a travs de las
variables deresumen. Las diferencias (Porcentual y Aritmtica), tambin
pueden ser realizadas combinando las categoras de la variable estado civil;
es decir, podemos comparar el comportamiento de la edad, los aos
estudiados o las ingresos de los gneros de las personas casadas. Para
realizarlo debemos seleccionar la lista desplegable de la variable Estado
civil y elegir la categora casado, con lo que obtendramos los resultados de
la tabla de le figura [6-60].

Figura 6-60

En la siguiente leccin conoceremos el ltimo boton de opcin conque


cuenta el procedimiento Cubos OLAP de SPSS.

Titulos en los Cubos OLAP de SPSS


El ultimo botn de opcin que encontramos en el cuadro de dialogo de
Cubos OLAP corresponde a Ttulo, a travs de l, podemos editar el ttulo y
las notas al pie que sern incluidas en el cubo. Al seleccionarlo aparece el
cuadro de dilogo correspondiente [Fig.6-61]; en este cuadro encontramos
dos casillas, la primera corresponde al ttulo y la segunda a las notas al pie.
En cualquiera de estas casillas podemos ingresar leyendas informativas
alfanumricas (letras, nmeros o smbolos) con un mximo de
255 caracteres.
A manera de ejemplo vamos a ingresar en los resultados del cubo
algunasleyendas informativas. Para realizarlo debemos volver al cuadro de
dilogo y seleccionar el botn Ttulo; al aparecer el cuadro ingresamos en la
casilla ttulo la leyenda Exploracin de las variables Gnero y Estado civil, y
en el casilla Pie ingresamos la leyenda Las diferencias Porcentual y
Aritmtica estn estipuladas para los Gneros de los entrevistados; para
finalizar hacemos clic en el botnContinuar y luego en Aceptar con lo que
los resultados se generan en el visor [Fig.6-62].
Figura 6-62

En conclusin, el procedimiento Cubos OLAP nos permite explorar


elcomportamiento de varias variables de escala a travs de estadsticos de
resumen, los cuales son expresados de acuerdo a una combinacin
especfica de categoras de mltiples variables categricas. La utilidad de
los cubos, radica en la posibilidad de apreciar el comportamiento de los
datos a medida que se definen nuevas combinaciones de categoras,
permitindonos observar aspectos especficos de la informacin como la
edad o los ingresos de las mujeres casadas. Adicionalmente,
el programa nos permite realizar comparaciones porcentuales o aritmticas
entre las variables de escala o inclusive entre las categoras de
una variable categrica.

CAPTULO8

Chi-Cuadrado Pruebas Estadisticas de SPSS


El procedimiento Tablas personalizadas, nos permite realizar tres
diferentespruebas estadsticas para determinar la relacin existente entre
las variables de filay columna. A travs de la pestaa Estadsticos de
contraste se puede solicitar para las variables que se ingresen en la
dimensin de filas y columnas, las pruebas de relacin / independencia,
comparacin de medias o la comparacin de porcentajes.

Para facilitar la interpretacin de estos procedimientos generaremos


algunos ejemplos de cada una de ella. Debemos resaltar que
las pruebas estadsticas aqu mencionadas hacen parte del anlisis de
inferencia y por lo tanto no sern exploradas a profundidad, sino que las
anexamos con el propsito de familiarizarnos con los objetivos de
cada prueba, como un prembulo al estudio de la estadstica de inferencia.

Prueba de independencia (Chi-cuadrado)


La prueba de independencia Chi-cuadrado, nos permite determinar si existe
una relacin entre dos variables categricas. Es necesario resaltar que
esta prueba nos indica si existe o no una relacin entre las variables, pero
no indica el grado o el tipo de relacin; es decir, no indica el porcentaje de
influencia de una variable sobre la otra o la variable que causa la influencia.

A manera de ejemplo crearemos un prueba Chi-cuadrado para las


variablesGnero y Estado civil; desde luego para crear la prueba es
necesario realizar la tabla, por lo que debemos volver al generador de tablas
y ubicar en la lista la variable gnero e ingresarla a las columnas,
sucesivamente ubicamos la variable Estado civil y la ingresamos a las Filas.
Una vez ubicadas la variables en las dimensiones, activamos (Hacer clic) la
pestaa Estadsticos de contraste, con lo que aparecen en el cuadro
las pruebas estadsticas disponibles [Fig.8-98].

Figura 8-98

Cada una de estas pruebas cuenta con la opcin Alfa (); este valor hace
referencia al nivel de confianza que deseamos que tengan los clculos de
laprueba; es decir, si queremos tener un nivel de confianza del 95%, el valor
de alfa debe ser del 0.05, lo cual corresponde al complemento porcentual de
la confianza. Continuando con el ejemplo, seleccionamos la prueba Chi-
cuadrado y mantenemos el valor del 0.05 en el Alfa; para finalizar hacemos
clic en Aceptar con lo que las tablas se generan el visor de resultados
[Fig.8-99].

El programa genera por defecto dos tablas; la primera de ellas corresponde


a la tabla de contingencia, en ella aparecen las variables seleccionadas y
los estadsticos que se hayan determinado en el procedimiento. La segunda
tabla corresponde a la prueba de Chi-cuadrado de Pearson y en ella
aparecen los resultados de las pruebas (valor del Chi-cuadrado, los grados
de libertad (gl) y el valor de significacin (Sig.)).
Figura 8-99

La prueba de independencia del Chi-cuadrado, parte de la hiptesis que las


variables (Estado civil y Gnero) son independientes; es decir, que no existe
ninguna relacin entre ellas y por lo tanto ninguna ejerce influencia sobre la
otra. El objetivo de esta prueba es comprobar la hiptesis mediante el nivel
de significacin, por lo que s el valor de la significacin es mayor o igual
que el Alfa(0.05), se acepta la hiptesis, pero si es menor se rechaza.

Para calcular el valor de significacin, el Chi-cuadrado mide la diferencia


global entre los recuentos de casilla observados y los recuentos esperados.
Entre mayor sea el valor del Chi-cuadrado, mayor ser la diferencia entre
los recuentos observados y esperados, lo que nos indica que mayor es la
relacin entre las variables. El valor de significacin corresponde a la
probabilidad de que una muestra aleatoria, extrada del Chi-cuadrado nos
d cmo resultado un valor superior a 39.672; es decir, es la probabilidad
que los datos de una muestra aleatoria extrada de las dos variables sean
independientes. Para nuestro ejemplo este valor es menor que el Alfa
(0.05), por lo que se rechaza la hiptesis de independencia y por lo tanto,
podemos concluir las variables Estado civil y Gnero estn relacionadas.

La prueba de independencia Chi-cuadrado, tambin puede ser empleada


con variables Anidadas y/o Apiladas. Si las variables se encuentran
anidadas, el programa genera una prueba por cada una de las subtablas
(Categoras) de la variable principal de la anidacin. Para comprender cmo
se ven afectadas laspruebas de independencia con la anidacin de
variables, retomaremos el ejemploanterior, pero anidando la
variable Regin dentro de las categoras del Gnero. Para realizarlo
debemos volver al generador de tablas; ubicamos en la lista la
variable Regin y la arrastramos hasta la dimensin de las columnas, de
manera que se anide a las categoras del gnero. Una vez ubicada las
variables hacemos clic en Aceptar con lo que las tablas se crean en el visor
de resultados [Fig.8-100].

Figura 8-100
Si nos fijamos en los resultados de la tabla, notaremos que el programa
realiza dos pruebas de independencia (Una para categora del Gnero). Al
igual que en elejemplo anterior, la relacin o independencia se determina de
acuerdo al valor de significacin.

Si nos fijamos en los resultados de la significacin de las


dos pruebas (0.574 y 0.689), notaremos que estos valores superan por un
alto margen el valor de alfa (0.05), por lo que debemos aceptar la hiptesis
de independencia para los hombres y las mujeres. Notemos que en la parte
inferior de la tabla aparecen algunas Notas que nos indican que ms del
20% de las casillas de cada tabla tienen frecuencias esperadas menores a
5, por lo que puede que los resultados de la prueba no sean validos. Estas
notas nos pueden advertir que existen irregularidades que afectan la
muestra, ya sea un sesgo muestral, la fidelidad de los datos o el tamao de
la muestra.

Ahora, cuando las variables se encuentran apiladas el programa genera


una pruebapor cada combinacin entre las variables de las filas y las
columnas. Para comprender el efecto de la apilacin en las pruebas de
independencia, retomaremos el ejemplo anterior pero pasando la
variable Regin de las columnas a las filas, apilndola con el estado civil.
Para realizarlo debemos volver algenerador de tablas y llevar la
variable Regin a las filas apilndola con la variableEstado civil. Una vez
ubicadas las variables hacemos clic en Aceptar con lo que las tablas se
crean en el visor de resultados [Fig.8-101].

Figura 8-101

Si nos fijamos en los resultados de la significacin para las dos pruebas,


notaremos que la variable Gnero se relaciona con la variable Estado civil,
pero es independiente con la variable Regin. Las pruebas de
independencia nos permiten determinar si existe una relacin entre
variables, pero para saber el grado de influencia y la direccin (Si es el
Gnero quien influye el Estado civil o viceversa), es necesario realizar una
serie de pruebas estadsticas complementarias.

Comparacion de Medias (Prueba t)


Otra de las pruebas estadsticas que podemos realizar por medio de
las Tablaspersonalizadas, es la comparacin de medias. A travs de esta
prueba se determina si existe una relacin entre una variable Categrica
(Ubicada en las columnas) y una variable de escala (Ubicada en las filas). El
objetivo de la prueba es determinar si existe una diferencia estadsticamente
significativa en el promedio de una variable de escala de acuerdo a las
categoras de una variable categrica y si la existe definir cual de las medias
es mayor.

Para comprender este concepto, realizaremos una prueba para las


variables Aos totales estudiados y la variable Gnero; para lograrlo
debemos volver al generadorde tablas y hacer clic en Restablecer con el fin
de retomar la configuracin inicial. Una vez aparece el cuadro, ubicamos en
la lista la variable Gnero y la ingresamos en las columnas, sucesivamente
ubicamos la variable Aos totales estudiados y la ingresamos en las filas.

Una vez ingresadas las variables, hacemos clic en el botn Estadsticos


deresumen de manera que aparezca el cuadro de dilogo correspondiente;
al aparecer el cuadro definimos en la columna formato (Tabla de seleccin)
el tipo de formato (nnnn) y posteriormente definimos en la columna
Decimales el valor uno (1) [Fig.8-102]; para finalizar hacemos clic en Aplicar
a seleccin con lo que volvemos al generador de tablas. Despus de definir
el estadstico, activamos la pestaa Estadsticos de contraste y
seleccionamos la opcin Comparacin de medias. Para finalizar hacemos
clic en Aceptar con lo que las tablas son creadas en el visor de resultados.

Figura 8-102

Por defecto el programa genera la tabla de contingencia entre las


variables Aos totales y Gnero [Fig.8-103]; en esta tabla se ensean los
valores de la media para cada una de las categoras del Gnero. Si nos
fijamos en los valores, notaremos que existe entre ellos una diferencia de
1.0 ao en el promedio de estudio de los hombres y las mujeres. Para poder
determinar si existe una diferencia estadsticamente significativa, debemos
fijarnos en la tabla de resultados de la prueba Comparacin de medias en
columnas [Fig.8-103].
Figura 8-103

Cuando se generan pruebas de comparacin de medias, el programa


asigna una letra para cada una de las categoras de la variable de columna.
En el caso especfico del el ejemplo, el programa asigna la letra A para el
gnero Femenino y para el gnero Masculino asigna la letra B. Los clculos
de la prueba t, estn definidos slo para un par de categoras, por lo que el
programa genera una prueba por cada par de categoras posible de acuerdo
al nmero de categoras de la variable de columna; dado que en este caso
la variable slo cuenta con dos categoras, el programa genera una sola
prueba.

Cuando existe una diferencia entre las medias de las categoras, el


programa ingresa en las casillas de las filas la letra de la categora que
cuenta con el menor promedio; por ejemplo, si nos fijamos en la casilla
Masculino, notaremos que aparece la letra A, esta letra nos indica que si
hay una diferencia significativa entre los valores de las medias de los dos
gneros y que a su vez la media del gnero masculino es mayor.

Al igual que las pruebas de independencia, la comparacin de medias se


puede realizar con variables anidadas o apiladas. Para observar como se
afecta la prueba con la anidacin de variables, retomaremos el
ejemplo anterior, pero anidando la variable Aos estudiados con la
variable Estado civil. Para realizarlo debemos volver
al generador de tablas e ingresar la variable Estado civil en las filas, de
manera que se anide con la variable Aos totales estudiados. Para finalizar
hacemos clic en Aceptar con lo que las tablas se crean en el visor de
resultados [Fig.8-104].

Figura 8-104

Dado que la variable Estado civil cuenta con cinco categoras, el programa
genera una prueba distinta para cada una de ellas. Si nos fijamos en los
resultados de latabla para la prueba de comparacin de medias, notaremos
que la nica categora que presenta diferencias estadsticamente
significativas en la media de los gneros corresponde al Estado civil Viudo,
en las filas de esta categora aparece la letra A, lo que nos indica que el
promedio (Media) de aos estudiados para los hombres es mayor que el de
las mujeres.

Comparacin de proporciones (Prueba Z)


La ltima prueba estadstica que se puede realizar por medio
del procedimientoTablas personalizadas corresponde a la comparacin de
las proporciones de las columnas. A travs de esta prueba se determina si
existe una diferencia estadsticamente significativa entre los porcentajes
obtenidos por cada una de las categoras de la variable ubicada en las
columnas de acuerdo al cruce con cada una de las categoras de la variable
ubicada en las filas; es decir, compara todos los porcentajes obtenidos para
las categoras de la variable de columna con la primera, segunda, etc,
categora de la variable de fila.

Para comprender los resultados de esta prueba, generaremos


un ejemplo con las variables Estado civil y la Regin. Para realizarlo
debemos volver al generador de resultados y hacer clic en el
botn Restablecer de modo que se retome la configuracin inicial. Una vez
aparece el cuadro ubicamos en la lista la variable Regin y la ingresamos
en las Columnas, posteriormente ubicamos la variable Estado civil y la
ingresamos en las filas.

Dado que la prueba evala la diferencia de los porcentajes de columna,


hacemos clic en el botn Estadsticos de resumen; al aparecer el cuadro,
resaltamos en latabla de seleccin el estadstico Recuento y lo
reemplazamos con el estadstico porcentaje de columna; para finalizar
hacemos clic en Aplicar a seleccin. Despus de definir las variables y el
estadstico activamos la pestaa Estadsticos de resumen y sucesivamente
seleccionamos la prueba Comparacin de proporciones de las columnas;
para finalizar hacemos clic en Aceptar y las tablas se crean en el visor de
resultados [Fig.8-105].
Figura 8-105

Al igual que en las pruebas anteriores, el programa realiza dos tablas. La


primera corresponde a la tabla de cruce o contingencia, en ella aparecen las
etiquetas de las variables, las categoras y los resultados de los estadsticos
que se hayan definido. La segunda tabla corresponde a los resultados de la
prueba.

Para esta prueba el programa asigna para cada categora de la variable de


Columna una letra (Norte = A, Este = B, Oeste = C y Sur = D);
adicionalmente genera una prueba de comparacin por cada par de
categoras de la variable de columna, cuyo objetivo es determinar si existe
una diferencia estadsticamente significativa entre los porcentajes de las dos
categoras. Si la hay, ubica en la casilla de cruce (Fila por columna) la letra
de columna a la que se comparo.

Por ejemplo, si nos fijamos en la fila Divorciado, notaremos que en la casilla


que se cruza con la columna Sur (Regin), aparecen la letra A; estas letras
nos indican que el porcentaje de columna para la categora Sur es
estadsticamente mayor que los porcentajes de las categoras Norte (Letra
A), para el cruce especfico con la categora Divorciado de la variable de
filas; es decir, que en las personas divorciadas las regiones Norte y Sur
cuentan con diferencias porcentuales estadsticamente significativas.

Si nos fijamos en los valores del porcentaje para la categora Norte del
cruce con Divorciado, notaremos que el valor corresponde a 2.5%, mientras
que el porcentaje para la categora Sur es de 9.8%. Desde luego estas
aseguraciones no se pueden realizar hasta generar la prueba. Cabe notar
que cuando alguno de los porcentajes es cero o menor que uno, las
pruebas de comparacin no pueden realizarse.
Las pruebas de comparacin tambin pueden ser aplicadas a
variables Anidadasy /o Apiladas. Para conocer la forma en que se afecta la
prueba con la anidacin de variables, retomaremos el ejemplo anterior, pero
ingresando la variable Gnero a las filas de manera que sus categoras
aniden a la variable Estado civil.

Para realizarlo debemos volver al generador de tablas, ubicar en la lista la


variableGnero y arrastrarla hasta las filas de manera que anide al costado
derecho de la variable Estado civil. Despus de ubicar la variable hacemos
clic en Aceptar con lo que las tablas se crean en el visor de resultados
[Fig.8-106]. Al igual que enejemplo anterior, el programa realiza una prueba
por cada una de las categoras de la variable de columna.

Figura 8-106

Es posible que los resultados de la prueba se modifiquen con la anidacin,


ya que al anidar las variables los porcentajes de columna tienden a variar.
Para analizar los resultados de las pruebas se deben tomar las categoras
de cada fila y concluir sobre el gnero al que corresponda. Por ejemplo, la
letra B en la fila divorciado nos indica que la categora Sur cuenta con
porcentajes de columna estadsticamente mayores que el Este para los
hombres.

En conclusin, las pruebas estadsticas que se incluyen en


el procedimiento Tablaspersonalizadas, nos permiten determinar si existe
una relacin entre las variables de fila y columna; teniendo en cuenta que
las pruebas Chi-cuadrado y Comparacin de proporciones slo pueden ser
utilizadas con variables Categricas y la prueba Comparacin de medias
slo puede ser empleada si existe una variable Categrica en las columnas
y una variable de escala en las filas. Adicionalmente, estas pruebas pueden
ser empleadas aun cuando se hayan anidado o apilado mltiples variables
en la dimensiones. Es importante resaltar que las pruebas estadsticas no
pueden ser empleadas cuando se incluyen en la tabla conjuntos de
respuestas mltiples.

Conjuntos de Respuesta Multiple


El mdulo de tablas nos permite realizar una gran variedad de tablas con los
conjuntos de respuesta mltiple ya sean de Dicotomas o Categoras
mltiples (vercapitulo 6). Debemos recordar que los conjuntos de
respuestas mltiples no se deben catalogar de forma estricta como
variables, ya que estos conjuntos no aparecen en el editor de datos y los
dems procedimientos del programa no los reconocen.

Los conjuntos de respuesta mltiple se emplean para agrupar varias


variables categricas, las cuales contienen las respuestas de una
pregunta Abierta (Los encuestados ingresan las respuestas que deseen)
o Cerrada (Los encuestados admiten reconocer o no las opciones que se
ofrecen). Dado que los conjuntos derespuesta mltiple son conformados por
variables categricas, el procedimientotablas personalizadas nos permiten
realizar con estos conjuntos las mismas tareas que se realizan con las
variables categricas (Anidar, Apilar, estadsticos, etc), exceptuando las
pruebas estadsticas de significacin.

Antes de realizar una tabla con conjuntos de respuesta mltiple, es


necesario definir los conjuntos de variables. Para hacerlo debemos abrir
primero el procedimientoDefinir conjuntos, el cual se ubica en el
men Analizar.. Tablas personalizadas.. Conjuntos de respuesta mltiple. Al
seleccionar este procedimiento aparece el cuadro de dilogo
correspondiente [Fig.8-107]. Este cuadro contiene las mismas
caractersticas de forma y uso del cuadro de definicin de conjuntos
explorado en el captulo 6.

Este cuadro se divide en dos grandes secciones; la primera corresponde a


la definicin de los conjuntos y la segunda a la casilla de seleccin de los
conjuntos. Para la definicin de los conjuntos, el procedimiento nos ofrece
diversas secciones entre las que encontramos la lista de variables, la casilla
de seleccin, las opciones de codificacin de los valores y las casillas del
nombre y la etiqueta del conjunto resultante.
Figura 8-107

Para comprender el procedimiento que se debe realizar en la definicin de


los conjuntos de respuestas mltiples (Dicotomas o Categoras), vamos a
definir los conjuntos Marcas y Conoce, empleados en el captulo 6. El primer
conjunto que definiremos comprende las variables desde Marca1 hasta
Marca7; estas variables contienen las respuestas a la pregunta Cuntas
marcas de automviles conoce?.

Para definirlo, debemos ubicar en la lista las variables (Marca 1,...., Marca
7), seleccionarlas (Hacer clic sobre la primera variable (Marca 1) y
manteniendo la tecla Shif oprimida hacemos clic en la ultima variable (Marca
7)). Una vez se resaltan las variables, hacemos clic en el botn Flecha ( ),
con lo que las variables son ingresadas a la casilla de seleccin. Despus
de seleccionar las variables, activamos la opcin Categoras; note que este
cuadro nos impide especificar el rango de valores, esto se debe a que el
procedimiento las extrae de las etiquetas de valor que se hayan definido
para la primera variable del conjunto, en las propiedades de la vista de
variables del editor de datos.

Posteriormente ingresamos en la casilla Nombre la leyenda Marcas y en la


casillaEtiqueta la leyenda Marcas de autos que conoce, con lo que
obtenemos los resultados de la figura [8-108]. Para finalizar hacemos clic en
el botn Aadir, con lo que el nombre del conjunto aparece en la casilla de
conjuntos precedido del signo dlares ($Marcas).
Figuras 8-108 y 8-109

Para definir el segundo conjunto, emplearemos las variables pgmerce,


pgaudi, pgmazda, pgpeug, pgbmw, pgtoyota, pgnissan, pgchevro y pgford.
Estas variables contienen las respuestas a la pregunta Conoce las marcas
de automviles (Mercedes,......., Ford)?. Para realizarlo, debemos ubicar en
la lista las variables e ingresarlas a la casilla de seleccin; una vez se
ingresan las variables seleccionamos la opcin Dicotomas, con lo que se
activa la casilla Valor contado. Dado que las respuestas de las variables son
de pertenencia (1= Reconoce) o ausencia (0 = Desconoce), y el valor que
nos interesa conocer es el de pertenencia, ingresamos en la casilla el
nmero uno (1).

Despus de especificar el valor contado, ingresamos en la casilla Nombre la


leyenda Conoce y en la casilla Etiqueta la leyenda Marcas de autos que
admite reconocer. Para finalizar hacemos clic en Aadir con lo que aparece
en la casilla de conjuntos el nombre del conjunto precedido del signo dlar
($Conoce) [Fig.8-109]. Una vez se han definido los conjuntos, hacemos clic
en Aceptar con lo que el cuadro se cierra y aparece en el visor de
resultados la tabla de definicin de los conjuntos de respuesta mltiple
[Fig.8-110].

Figura 8-110
En esta tabla se hace una relacin de los nombres de los conjuntos, el tipo
de respuestas, el tipo de datos y las variables que componen cada uno de
los conjuntos que se han definido. En las siguientes lecciones haremos
algunosejemplos de tablas personalizadas con conjuntos
de respuesta multiple.

Tablas con Conjuntos de Respuesta Multiple


Una vez se han definido los conjunto, se puede crear las tablas; para
realizarlo debemos abrir primero el generador de tablas mediante la
ruta Analizar.. Tablas..Tablas personalizadas. Al abrir el generador
de tablas, aparecen en la parte inferior de la lista de variables, dos nuevas
variables denominadas $Marcas y $Conoce. Estas variables se encuentran
precedidas por los iconos ( ) el cual define los conjuntos de Dicotomas
mltiples y el icono ( ) el cual define los conjuntos deCategoras [Fig.8-
111].

Los conjuntos de respuesta mltiple pueden ser empleados para crear las
mismastablas que las variables categoras, como tablas de frecuencias, de
contingencia, anidadas, apiladas o capas. A manera de ejemplo, crearemos
algunas de estos tipos de tablas con el conjunto de dicotomas ya que es el
que contiene el menor nmero de categoras. Para nuestro primer ejemplo
crearemos una tabla de frecuencias, por lo que ubicamos en la lista de
variables el conjunto de dicotomas ($Conoce) y lo arrastramos hasta las
filas. Para finalizar hacemos clic en Aceptarcon lo que la tabla se crea en el
visor de resultados [Fig.8-112].

Si nos fijamos en los resultados, notaremos que aparece la etiqueta del


conjunto (Marcas de autos que admite reconocer), las etiquetas de las
marcas (Estas etiquetas son extradas de las etiquetas de las variables; si
no se define una etiqueta para las variables el programa muestra el nombre
de la variable) y por ltimo los recuentos. Desde luego esta es la aplicacin
ms sencilla que se puede realizar con los conjuntos de respuesta mltiple.
Para aumentar un poco la dificultad de esta tabla ingresaremos algunos
estadsticos adicionales, as como tambin un total.

Figura 8-112
Cuando se trabaja con conjuntos de respuesta mltiple aparecen en el
listado de estadsticos algunas medidas exclusivas para el anlisis de
conjuntos como lasrespuestas o los porcentajes de respuestas (% de fila, %
de columna, %de subtabla y el %del total de las respuestas). Para
comprender la diferencia entre los estadsticos tradicionales y los
estadsticos de los conjuntos, retomaremos el ejemplo anterior, pero en esta
ocasin adicionaremos algunos estadsticos.

Para realizarlo debemos volver al generador de tablas y seleccionar el


botnEstadsticos de resumen con lo que aparece el cuadro
correspondiente [Fig.8-113]. Este cuadro mantiene las mismas
caractersticas de forma y uso del cuadro descrito para las variables
categricas; sin embargo, si nos fijamos en la lista de estadsticos
notaremos que aparecen una serie de medidas porcentuales basadas en
las respuestas.

Figura 8-113

Continuando con el ejemplo ubicamos en la lista de estadsticos el


porcentaje detabla y lo ingresamos a la tabla de seleccin, sucesivamente
ubicamos el estadstico Respuestas y lo ingresamos a la tabla de seleccin;
por ltimo ubicamos el porcentaje de respuestas de tabla y lo ingresamos;
para finalizar hacemos clic en Aplicar a seleccin con lo que volvemos al
generador de tablas. Una vez definidos los estadsticos, activaremos el total
para comparar los resultados; para lograrlo hacemos clic en el
botn Categoras y totales, al aparecer el cuadro activamos la opcin Total y
hacemos clic en Aplicar. Despus de definir los estadsticos y el total
hacemos clic en Aceptar con lo que la tabla se crea en el visor de resultados
[Fig.8-114].
Figura 8-114

Si nos fijamos en los resultados de los


estadsticos Recuento y Respuestas para cada una de las categoras
notaremos que cuentan con los mismos valores; mientras que los resultados
del total presentan una gran diferencia. Esto se debe a que el total del
estadstico Recuento representa el nmero de Casos validos que fueron
tenidos en cuenta para los clculos, mientras que el total de
las Respuestasse calcula sumando todas las respuestas validas (Valor 1
o Valor contado), de cada una de las opciones.

De igual manera sucede con el porcentaje de tabla y el porcentaje


de respuestasde tabla; fjese que en el porcentaje de tabla aparecen
altos valores en cada una de las categoras del conjunto y la suma del total
aparece como el 100%. Este porcentaje (% de tabla) nos indica la
proporcin de los casos en que losEncuestados admite reconocer cada una
de las marcas y por lo tanto es elempleado para realizar las conclusiones;
es necesario resaltar que el valor del total es calculado a travs del
porcentaje de casos validos y por lo tanto no representa la suma porcentual
de las categoras; para poder obtener la suma porcentual de las categoras,
debemos seleccionar el estadstico porcentaje de respuestas de tabla(Base:
Recuento).

El segundo porcentaje de la tabla (% de respuestas de tabla), nos indica la


proporcin de las respuestas que se obtienen por cada categora y es
calculado basndose en el nmero total de respuestas validas; por medio
de este porcentaje se puede determinar cuales serian las proporciones
obtenidas por un nuevo grupo de personas (Encuestados) al realizar
nuevamente las mismas preguntas, desde luego este porcentaje no debe
ser empleado para hallar las conclusiones.

También podría gustarte