Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin al SPSS
Para ingresar al programa, tenemos dos opciones; la primera es mediante el
acceso directo ubicado en el Escritorio (Si lo hay) y la segunda es mediante
la rutaInicio.. Programas.. SPSS para Windows.. SPSS para Windows.
Aclaracin:
Los tipos de archivos que genera SPSS, los cuales son:
Barra de Mens
Como la mayora de los programas basados en el sistema
operativo Windows, el Editor de datos de SPSS cuenta con una barra de
mens desplegables, en donde se encuentran las diferentes opciones,
procedimientos y aplicaciones que se pueden ejecutar con el programa. En
SPSS se cuenta con diez diferentes mens desplegables [Fig.1-21]; dentro
de los que encontramos Archivo, Edicin, Ver, Datos, Transformar, Analizar,
Grficos, Utilidades, Ventana y Ayuda (?).
Figuras 1-17
Figuras 1-22
Figuras 1-23
Figura 1-24
Figuras 1-26
Figuras 1-27
Figuras 1-29
Figuras 1-30
Figuras 1-31
Barra de Posicin
La barra de posicin esta ubicada debajo de la barra de herramientas en el
editor de datos y nos permite identificar de forma rpida y sencilla el nmero
del caso (Fila), la variable (Columna) y el valor de la casilla de registro que
hemos seleccionado [Fig.1-32]. Para activar la barra, debemos hacer clic sobre
cualquiera de las casillas del editor de datos, con lo que aparecer de forma
automtica la informacin de la casilla. La utilidad de esta casilla se pone en
evidencia cuando trabajamos con archivos que cuenten con un nmero elevado
de registros.
Figura 1-32
Figuras 1-33
Figuras 1-35
Si nos fijamos en las estructuras de las vistas del Editor de datos, notaremos
que para la vista de datos, las variables se ubican en las columnas y los casos
o registros se ubican en las filas, mientras que para la vista de variables, las
propiedades (Definicin) se ubican en las columnas y las variables se ubican
en las filas. Una vez aclaradas las diferencias estructurales de las vistas,
continuaremos describiendo cada una de las propiedades de las variables, las
cuales determinan en gran medida los diferentes procedimientos que se
pueden realizar con los datos.
I. Nombre:
Este parmetro nos permite identificar y diferenciar las variables que componen
el archivo; para cada una de las variables se debe definir un nombre especfico.
El programa establece una serie de normas para los nombres de variables,
entre las que encontramos:
Para las versiones anteriores de SPSS (11.5, 11.0, 10.0, etc.) la longitud de las
variables es de slo ocho Bytes, lo cual generalmente no es suficiente para
identificar una variable, por lo que es recomendable utilizar las tres primeras
letras de cada palabra de la frase; es decir,
II. Tipo:
La propiedad Tipo, nos permite especificarle al programa la naturaleza de los
datos que se incluyen dentro de la variable; es decir, nos permite definir la
forma y el significado de los caracteres que se encuentran en los registros de la
variable. SPSS nos permite elegir entre ocho diferentes tipos de variables para
representar Nmeros (Magnitudes), Fechas (Tiempo), Monedas (Dinero) y
Letras (Cadena). Desde luego es aconsejable trabajar las variables de forma
numrica ya que el anlisis estadstico es una ciencia matemtica y para su
correcto funcionamiento es necesario realizar las operaciones con nmeros; ya
que en algunos casos no es posible tener los datos de forma numrica, el
paquete nos permite trabajarlos como una cadena de caracteres (Letras y
Nmeros).
Figura 1-36
Coma y/o Punto: Estos dos tipos de variables se emplean en una variable
numrica cuyos valores representan magnitudes o cantidades. Al seleccionar la
opcin Coma los valores se asocian con comas que delimitan cada tres
posiciones y con el punto como delimitador decimal 1,000.00. Cuando se
selecciona el Punto los valores se asocian con puntos que delimitan cada tres
posiciones y con la coma como delimitador decimal 1.000,00.
Figura 1-37
III. Anchura:
Por medio de esta propiedad podemos definir el mximo de dgitos que
contienen los registros de una variable; para el clculo del ancho se
incluyen los dgitos enteros y los decimales. Por ejemplo;
IV. Decimales
A travs de este parmetro se define el nmero de dgitos decimales que
pueden contener los registros de la variable. Las cifras que superen esta
longitud sern aproximadas por el programa. Cuando una cifra supera la
longitud, el programa aproxima hacia arriba los dgitos que sobrepasen la
longitud si el valor del ltimo de ellos es igual o mayor que cinco, de lo
contrario (menor que 5) se aproxima hacia abajo; es decir:
1.07X si X < 5 entonces se aproxima a 0 es decir = 1.07
1.07X si X => 5 entonces se aproxima a 10 es decir = 1.08
Figuara 1-40
Hay que notar que cuando seleccionamos los Tipos de variables como
la Fecha yCadena estas propiedades se desactivan; esto se debe a que
para el tipo de formato Fecha el programa ha predefinido estos parmetros
y no podemos alterarlo, la nica opcin que tenemos es escoger otro
formato de fecha; mientras que para el tipo cadena no se puede tener
nmeros decimales.
V. Etiqueta
Dado que generalmente los sesenta y cuatro (64) caracteres del nombre
(Versiones anteriores ocho [8]) y las normas que se deben cumplir, no
permiten describir de forma clara la variable y el contenido de ella; SPSS
nos brinda la posibilidad de utilizar una etiqueta por medio de la cual
podemos describir lavariable mediante la utilizacin de un mximo de 255
caracteres.
V. Valores perdidos
Los valores perdidos son razones por las cuales no obtenemos
una respuesta coherente de algn entrevistado; es decir, es una razn que
nos indica la causa por la que no me aporta informacin el entrevistado.
Dentro de los valores perdidos podemos encontrar:
No sabe
No responde o se niega a responder
No aplica o sencillamente la pregunta no lo afecta EJ: preguntarle a una persona
soltera la edad a la que se caso por primera vez, si no se ha casado nunca
esta pregunta no lo afecta.
Debemos tener claro que los valores perdidos son razones y no errores,
generalmente tendemos a confundir un valor perdido con un valor que no esta
dentro de nuestro rango. Por ejemplo, si en la variable gnero (sexo), tenemos
losvalores (1 = mujeres y 2 = hombres) y despus de revisar el archivo nos
damos cuenta que tenemos en algunos registros el valor 3, generalmente
cometemos el error de pensar que este es un valor perdido, pero no lo es, este
tipo de valores los debemos considerar como errores ya sea de digitacin o de
captura y la forma de corregirlos es ir hasta la fuente (entrevistas) y determinar
a que grupo perteneca el individuo. Si no podemos determinar el grupo y
los valores son muy pocos es recomendable prescindir de estos casos.
Figuras 1-42
Para este tipo de valores se recomienda que exista una distancia considerable
entre los valores representativos y los perdidos con el fin de facilitar su
identificacin). La tercera y ltima opcin corresponde a Rango ms un valor
discreto opcional (se utiliza cuando tenemos varios parmetros de valores
perdidos, los cuales se encuentran dentro de un rango. Para seleccionar esta
opcin es necesario que no existan valores representativos de grupos dentro
del rango de lo contrario sern omitidos de los clculos. Adems esta opcin
nos permite ingresar un valor discreto adicional). Para seleccionar cualquiera
de las opciones basta con hacer clic sobre la opcin de manera que aparezca
en la casilla de activacin ( ) un punto negro y sucesivamente ingresar
los valores.
VIII. Medidas
Este es el parmetro ms importante de las variables, de su definicin depende
el tipo de anlisis que podemos realizar con el programa. Dentro de la
estadstica se han catalogado cuatro diferentes escalas de medida, pero para
SPSS estas escalas se resumen en slo tres:
IX. Valores
Los valores o Etiquetas de valor nos permiten generar una leyenda que facilite
la interpretacin de los nmeros representativos de cada categora de una
variable, ya sea en los resultados o en la vista de datos. Debido a que se
utilizan nmeros para representar cada categora es necesario crear
una pequea leyenda que nos permita ver en letras la categora a la que
corresponde cada nmero. Las etiquetas de valor no pueden exceder los 60
caracteres y se deben emplear solamente si se cumplen los siguientes
requisitos:
Figura 1-43
Figuras 1-46
En este cuadro se manejan todas las opciones del paquete. Podemos
observar que en la parte superior del cuadro hay una serie de pestaas;
cada una de ellas corresponde a un proceso especfico del paquete. Dentro
de estos procesos encontramos (General, Visor, Visor de borrador,
etiquetas de los resultados, grficos, interactivos, tablas pivote, datos,
moneda y procesos). Al seleccionar uno de ellos, el contenido de la ventana
cambiar y nos mostrar las opciones que cada pestaa maneja. Por el
momento nos concentraremos en la pestaa General, en ella
encontraremos la opcin listas de variables, en la parte superior izquierda.
Figura 1-47
Figura 1-48
Continuando con el ejemplo, debemos ubicar las variables Gnero y Estado
civil (Estciv) en la lista de variables e ingresarlas a la casilla de seleccin.
Para hacerlo, debemos resaltar la variable deseada (Gnero) en la lista y
sucesivamente hacer clic en el botn flecha, de manera que aparezca en la
casilla de seleccin. Una vez ingresamos las dos variables, hacemos clic en
el botn Aceptar, ejecutando lastablas de frecuencia y sus consecuencias
son presentadas en la ventana Visor deresultados. Las dems partes de la
ventana Frecuencias, sern explicadas a profundidad en los captulos
posteriores.
Figuras 1-51
Navegador de Resultados
A travs del navegador de resultados, podemos explorar todos los resultados
obtenidos mediante los distintos procedimientos del paquete, as como tambin
organizarlos de acuerdo a nuestro criterio o las necesidades del reporte. SPSS
ha estructurado el navegador de forma jerrquica, con el fin de establecer un
orden en los resultados. Para comprender la estructura bsica
del navegador de resultados debemos observar la figura [1-52].
Figura 1-52
Figuras 1-54
Este cambio se debe a que los mens Datos y Transformar slo contienen
opciones aplicables a los datos (Registros y variables) cuando se encuentran
desagrupados y por lo tanto deben ejecutarse en el editor de datos de SPSS.
De igual manera los mens Insertar y Formato slo contienen procedimientos
que slo pueden ser ejecutados en el visor de resultados ya que estn
orientados a los resultados.
Figuras 1-55
Figura 1-56
Figura 1-57
Figura 1-58
Figuras 1-59
Estos elementos surgen, debido a que SPSS nos permite guardar los
archivos de datos en una diversidad de formatos como Excel, dBASE, SAS,
Archivos de texto, etc. Cuando se elige el formato Excel en la
seccin Guardar como, se habilitan las dos primeras opciones de la ventana
(Escribir nombres de variables en hoja de clculo y Guardar etiquetas de
valores donde se hayan definido en vez de los valores de datos). Si por el
contrario se elige el formato SAS, solamente se activa la ltima opcin
(Guardar etiquetas de valor en un archivo .sas). La utilidad de estas
opciones radica en la posibilidad de guardar aspectos informativos
fundamentales de las variables, dentro de los archivos de otro tipo de
formato.
Figuras 1-66 y 1-67
Por otro lado, el botn Variables nos permite definir las variables que sern
incluidas dentro del archivo. Al activar este botn, surge un nuevo cuadro de
dilogo [Fig.1-67], a travs del cual se especifican las variables del archivo
resultante. Por defecto el programa selecciona todas las variables; si se
desea excluir algunas de ellas, es necesario hacer clic sobre la casilla de
seleccin que se encuentra al costado izquierdo de la variable, de manera
que desaparezca la marca X. Por lo general, este procedimiento es
empleado cuando deseamos guardar parte o la totalidad de las variables
dentro de un archivo de formato distinto al de SPSS. Por el momento no
utilizaremos esta opcin, por lo que hacemos clic en el botn Cancelar de
esta nueva ventana.
Cada comando debe empezar en una lnea nueva y terminar con un punto
(.).
La mayora de los subcomandos estn separados por barras inclinadas (/).
La barra inclinada que precede al primer subcomando de un comando,
generalmente es opcional.
Los nombres de variable deben escribirse completos.
El texto incluido entre apstrofos o comillas debe ir contenido en una sola
lnea.
Cada lnea de la sintaxis de comando no puede exceder los 80 caracteres.
Debe utilizarse un punto (.) para indicar decimales, independientemente
de la configuracin regional de Windows.
Los nombres de variable que terminen en un punto pueden causar errores
en los comandos creados por los cuadros de dilogo. No es posible crear
nombres de variable de este tipo en los cuadros de dilogo y en general
deben evitarse.
Para comprender la forma de pegar y correr la sintaxis de un procedimiento,
vamos a retomar la tabla de frecuencias que realizamos para las variables
Gnero y Estados civil (estciv) en los apartados anteriores. Para realizarlo nos
apoyaremos en uno de los botones de la barra de herramienta descritos
con anterioridad correspondiente a Recuperar cuadros de dilogo ( ); al
activarlo se despliega la lista de procedimientos que se han generado con el
programa; en ella elegimos la opcin frecuencias, con lo que surge
nuevamente el cuadro de dilogo correspondiente [Fig.1-70]. Una vez aparece
el cuadro, ubicamos en la lista las variables Gnero y Estciv y las ingresamos
en la casilla de seleccin. Despus de ingresarlas hacemos clic en Pegar, de
modo que se cierre el cuadro Frecuencias y a su vez aparece en la ventana de
sintaxis los comandos del procedimiento [Fig.1-71].
Figura 1-70
Figura 1-71
Al seleccionar la opcin Todo del men Ejecutar, el programa ejecuta todos los
comandos de sintaxis que se encuentren en el archivo; si por el contrario
elegimos la opcin seleccin, el programa ejecuta solamente los comandos
seleccionados por el usuario dentro del archivo. Si elegimos Actual, el
programa ejecuta la sintaxis del comando en el que se encuentre el cursor de
ratn. Por ltimo si elegimos hasta el final, el programa ejecuta la sintaxis de
comandos que se encuentren desde la ubicacin del cursor del ratn hasta la
sintaxis del fin del archivo.
Figuras 1-72
Figura 1-70
CAPITULO III
En los procesos de investigacin la informacin proviene de diferentes fuentes,
como lo pueden ser las encuestas, las mediciones, los experimentos e incluso
de investigaciones previas. Generalmente esta informacin es recopilada en
diversosprogramas de computadora que permiten organizarla, de acuerdo a las
caractersticas de los datos y las normas estructurales del programa en que se
originen, para luego ser analizada y extraer de ella las respectivas
conclusiones.
Figura 3-1
Para poder definir las propiedades de las variables es necesario hacer clic
sobre la pestaa Vista de variables en la parte inferior izquierda del editor,
de manera que el contenido de la ventana cambie y nos muestre las
columnas de propiedad [Fig.3-3]. Es importante recordar que en esta vista
las variables se ubican en las filas y las propiedades en las columnas.
Figura 3-4
Figura 3-5
Figura 3-6
Figura 3-7
Figura 3-8
Una vez establecidos los valores de Anchura y Decimales, debemos definir las
Etiquetas o leyendas informativas que para este caso son (Estciv = Estado civil,
Niveduc = Nivel de educacin y Edad = Edad en aos). Para ingresar las
etiquetas, se deben seleccionar cada una de las casillas e ingresar las
letrascorrespondientes, de manera que se obtengan los resultados de la figura
[3-10].
Figura 3-10
Figura 3-11
Para definir los valores de una variable, basta con ingresar el nmero en la
casillaValor, sucesivamente ingresar en la casilla Etiqueta de valor las letras de
la categora a la que corresponde y finalizar haciendo clic en el botn Aadir.
Este proceso debe realizarse por cada uno de los valores que tome la variable.
Paracontinuar con el ejemplo ingresaremos el nmero uno (1) en la casilla
valor, posteriormente hacemos clic en la tecla TAB ( ) para pasar a la
siguiente casilla o hacemos clic sobre la casilla e ingresamos en su interior la
frase Soltero. Para finalizar hacemos clic en el botn Aadir, de manera que
aparece en la casilla de seleccin la frase (1 = Soltero) [Fig.3-12]. Esta
leyenda es la confirmacin que el valor y la etiqueta han sido definidos
satisfactoriamente.
Figura 3-12
Este mismo proceso debe ser realizado con cada uno de los valores de la
variable estciv (Estado civil), de manera que se definan los valores
(2=Casado, 3=Divorciado, 4=Viudo, 5=Unin libre y 9=No responde).
Figura 3-13
Para finalizar hacemos clic en Aceptar con lo que volvemos al editor de datos
de SPSS. Note que en las dos variables (Estciv y Niveduc) se asigno el nmero
nueve (9) a los valores perdidos definidos por el usuario (No responde); esto se
hace con el fin de facilitar su identificacin dentro del archivo de datos y es
recomendable mantener los mismos nmeros para los valores perdidos de las
dems variables, siempre que sea posible.
Figura 3-14
Figura 3-16
Debemos recordar que un valor perdido es una razn por la cual no obtengo
informacin del entrevistado. El nmero 9 nos indica que no obtuve informacin
por que el entrevistado no respondi. Es aconsejable utilizar nmeros elevados
para losvalores perdidos, de manera que estn separados del rango til
(valoresrepresentativos de categoras), ya que esto facilita su identificacin.
Para finalizar hacemos clic en Aceptar con lo que volvemos al editor de datos
de SPSS.
Figura 3-17
Si nos fijamos en los resultados de las cinco encuestas, notaremos que slo se
presento la falta de respuesta en una de ellas, correspondiente a
la preguntaEstado civil de la quinta encuesta. Note como a pesar que se defini
un valor perdido para la variable Nivel de educacin, este valor no es utilizado
por ninguno de los encuestados; cuando ocurre este suceso, no es necesario
eliminar el valor ya que el nmero definido acta slo como una medida de
control a las posibles faltas de informacin en las encuesta.
Para comenzar el ingreso de la informacin, debemos seleccionar la pestaa
Vista de datos, de manera que el contenido del Editor de SPSS cambie y nos
ensee las columnas de variables. Para insertar los datos, debemos ubicarnos
en la primera casilla de la variable numeiden y comenzar a ingresar cada uno
de los nmeros. Para pasar de una variable a otra, el mtodo ms sencillo es
recurrir al botn TAB ( ) ubicado en el teclado del ordenador, ya que este
botn nos va pasando de una variable a otra hasta que llegar a la ltima
variable declarada de la fila, donde al oprimir nuevamente la tecla en TAB, el
programa activa la primera casilla de la nueva fila (Variable numeiden). Una
vez ingresamos la totalidad de los valores para las cinco encuestas (Casos),
obtenemos los resultados de la figura [3-20].
Figuras 3-20 y 3-21
Figura 3-22
1. Hojas de Clculo
Para importar la informacin contenida en un archivo proveniente de una Hoja
de clculo, ya sea de Excel o Lotus, es necesario comprobar previamente, que
los datos en el archivo cumplen con los requerimientos estructurales de SPSS.
Los parmetros que deben cumplir son Estructura de datos (los archivos de
SPSS cuentan con una estructura en sus datos [ver captulo 1], en la cual la
informacin, registros u observaciones se encuentra en las filas y las variables
en las columnas.
Figura 3-23
Figura 3-26
La primera opcin Leer nombre de variables de la primera fila de datos, nos
permite capturar o extraer los nombres de las variables que aparecen en el
archivo de origen, slo si estos se encuentran en la primera fila de informacin
til del archivo y cumplen con las caractersticas requeridas. Si nos fijamos en
el contenido de la figura [3-23], notaremos que la fila siete (7) contiene los
nombres de las variables; estos nombres deben cumplir ciertas condiciones
(ver captulo I), como no tener ms de 8 caracteres (para las versiones
anteriores a la 12.0), comenzarcon una letra y no contener caracteres
especiales.
Figura 3-27
Figura 3-29
Figura 3-30
Figura 3-31
Si la informacin requerida para la importacin se encuentra en diferentes
hojas de un mismo archivo, es necesario generar una nueva hoja donde se
recopile todos los datos, ya que este procedimiento slo permite extraer la
informacin contenida en una hoja, por cada importacin. Desde luego, para
poder obtener un archivo de datos completo, es necesario definir cada una de
las propiedades de las variables.
Figura 3-32
Figuras 3-33
Generalmente los archivos de ancho fijo no suelen incluir dentro de los datos
los nombres de las variables, por lo que reconocer la informacin comprendida
en este tipo de archivos es ms difcil. Para poder identificar la informacin
contenida en los archivos de ancho fijo es necesario trazar una lnea entre cada
una de sus variables [Fig.3-34].
Figura 3-34
En resumen las variables Delimitadas son aquellas que estn separadas por un
carcter especfico como el punto, el espacio, el tabulador, etc. Mientras que
las variables de ancho fijo son aquellas que tienen un nmero mximo de
caracteres por variable. Una vez aclarado este concepto procederemos a
importar un archivo de texto mediante el asistente de importacin. Primero
extraeremos la informacin de un archivo delimitado y despus de un archivo
de ancho fijo, con el fin de exponer las diferencias que se presentan en la
definicin de los datos.
Figura 3-28
Figura 3-38
Para poder determinar como estn organizadas las variables dentro del
archivo, debemos observar el contenido del visor de datos [Fig.3-39] y tratar
de identificar si las variables estn separadas por un carcter comn o por
el contrario tiene un nmero especfico de columnas por variable. Si nos
fijamos en los datos del visor, notaremos que las variables se encuentran
separadas por un cuadrado ( ), el cual representa en SPSS al tabulado, con
lo que podemos determinar que las variables estn delimitadas por
tabulaciones. Es importante recordar el carcter ( = Tabulador), ya que en
los pasos siguientes, el asistente necesitar que lo especifiquemos. Una vez
definido el tipo de archivo, debemos seleccionar la opcin Delimitado en la
primera pregunta.
Figura 3-39
Una vez definido el formato del archivo hacemos clic en Siguiente, con lo
que aparece el cuadro de dilogo correspondiente al paso 3 [Fig.3-40]; en
este cuadro el asistente nos realiza tres preguntas sobre la forma de los
casos. La primera de las preguntas corresponde a En qu nmero de lnea
comienza el primer caso de los datos?, por defecto el programa declara la
segunda lnea como la fila de inicio de los casos, esto se debe a que en el
paso anterior le especificamos al asistente que los nombres de las variables
se encontraban en la primera fila, de lo contrario el primer caso se hallara
en la primera fila del archivo.
Figura 3-41
En este caso el carcter comillas () nos indica que se trata una variable
alfanumrica. SPSS nos permite especificar cualquier carcter como
identificador, con la nica condicin que sea el mismo para todas las variables
alfanumricas.
En el archivo de ejemplo las variables alfanumricas no estn precedidas de
ningn carcter, por lo que seleccionamos la primera opcin (Ninguno). Note
como en este paso se activa el Botn Finalizar; al seleccionarlo podemos pasar
directamente al ltimo paso del asistente, por el momento no lo
seleccionaremos para poder conocer los siguientes pasos del asistente.
Adicionalmente, si nos fijamos en la parte inferior del cuadro de dilogo del
paso 4, observaremos una vista previa de los datos, en donde se expone
grficamente como esta quedando el archivo resultante, lo que es de bastante
utilidad para identificar los posibles errores que se hayan cometido en la
definicin de la informacin.
Para continuar con la extraccin de los datos hacemos clic en Siguiente, con lo
que aparece el cuadro de dilogo correspondiente al paso 5 [Fig.3-42]. En este
paso se puede modificar el nombre de las variables y el tipo al que
corresponde, as como tambin nos permite restringir las variables que se
importarn. En la parte superior del cuadro de dilogo se encuentran dos
casillas donde se debe especificar el nombre y el formato de los datos.
Para definir las opciones de guardado, el asistente nos realiza dos preguntas;
la primera de ellas corresponde a Desea guardar este formato de archivo para
su uso en el futuro?. Esta opcin permite aplicar la definicin de las variables
que acabamos de realizar a futuros archivos. Desde luego, estos archivos
deben contar con las mismas caractersticas del archivo delimi.txt; es decir, los
futuros archivos deben tener el mismo nmero de variables y estar ubicadas en
el mismo orden, por lo que el nmero de casos es el nico factor que puede
cambiar.
Figura 3-44
Una vez terminada la definicin de los datos, hacemos clic en Finalizar, con lo
cual los datos son importados y representados en el editor de datos [Fig.3-45].
Nuevamente es necesario guardar el archivo resultante y definir las
propiedades de las variables para obtener un archivo de datos de SPSS.
Figura 3-45
Para culminar con los archivos planos o de texto en formato Delimitado, vamos
a utilizar el formato predefinido guardado en el ltimo paso; este formato lo
aplicaremos al mismo archivo para poder identificar su funcin. Para realizarlo
debemos ir al men Archivo y seleccionamos la opcin Leer datos de texto, con
lo cual se abre una ventana de navegacin, donde ubicamos el archivo
delimi.txt dentro del CD adjunto. Una vez ubicado el archivo, lo seleccionamos
y hacemos clic en Abrir, con lo que aparece nuevamente al Asistente para la
importacin de archivos de texto.
Figura 3-46
Por defecto, esta ventana define el Tipo de archivo en Texto (*.txt); para el
archivo de ejemplo, debemos cambiarlo al formato Datos (*.dat), por lo que
hacemos clic sobre el botn de contenido ( ) ubicado al costado derecho
de la casilla. Una vez se activa el listado de formatos, debemos seleccionar
el formato correspondiente a Datos [*.dat]. Despus de cambiar el tipo de
formato, ubicamos por medio de la casilla Buscar en,
la carpeta Captulo3 dentro de la unidad de CD, de modo que se haga
visible su contenido; dentro de ella ubicamos el archivo Ancho [Fig.3-49], lo
seleccionamos y hacemos clic en Abrir, con lo que aparece el cuadro de
dilogo del Asistente para la importacin de texto [Fig.3-50].
Este cuadro contiene las mismas caractersticas del cuadro obtenido con el
archivo Delimitado, la nica diferencia que se puede resaltar se presenta en
la visualizacin del archivo. Si nos fijamos en la vista de datos, notaremos
que dentro de la informacin no aparece un carcter de separacin, por lo
que los datos de cada variable son de difcil identificacin. Dado que no se
cuenta con un archivo de formato predefinido para archivos de ancho fijo,
seleccionaremos la opcin NO y sucesivamente hacemos clic en Siguiente,
con lo que aparece el cuadro de dilogo correspondiente al paso 2 de 6
[Fig.3-51].
En este paso debemos definir las opciones de formato de los datos. Para
definirlo, el asistente nos hace la pregunta Cmo estn organizadas sus
variables?; si nos fijamos en el visor de datos, notaremos que las variables
no tienen un carcter especifico entre cada una de ellas, lo que dificulta el
reconocimiento de los datos; este suceso nos permite determinar que el
archivo corresponde al formato de ancho fijo.
Una vez determinado el formato del archivo hacemos clic en Siguiente, con
lo que aparece el cuadro de dilogo correspondiente al paso 3 de 6 [Fig.3-
52], en este paso se definen las opciones de los casos. Dentro de estas
opciones encontramosEn qu nmero de lnea comienza el primer caso de
los datos?, Cuntas lneas representan un caso? y Cuntos casos desea
importar?.
La primera fila de datos debe ser por lgica el lugar en donde comiencen los
datos, ya que en el paso anterior definimos que los nombres de las
variables no se incluan en la primera fila. Para determinar cuantas filas
representan un caso, es necesario dirigirnos al final de las lneas empleando
la barra de desplazamiento horizontal que aparece en la vista previa de
datos y tratar de observar si cada una de las filas cuenta con un longitud
aproximadamente igual, de lo contrario es indispensable recurrir al libro de
variables; en nuestro ejemplo cada fila representa un caso.
Si nos fijamos en la parte superior del cuadro, notaremos que aparecen las
instrucciones de cmo utilizar las lneas de corte; dentro de
estas instruccionesencontramos los procedimientos de como modificar
insertar o eliminar lneas. Las lneas deben ser ingresadas y editadas en la
vista previa de datos; para facilitar la ubicacin de cada lnea, el asistente
incluye un indicador de columna en la parte superior de la Vista previa de
datos, el cual esta estipulado de 10 en 10 y con unas marcas de
identificacin para cada nmero de lnea intermedio [Fig.3-54].
Figura 3-54
Si nos fijamos en los datos de la tabla, notaremos que las variables que
extraeremos corresponden al nmero de encuesta (Columnas de la 1 a la 4),
Ciudad (columna 2), Gnero (columna 6), Edad (columnas 9 y 10), Estado civil
(columna 28) y Nivel de educacin (Columna 30). Esta informacin debe ser
generada por el creador del archivo, aunque algunos programas la
proporcionan en el momento de formarlo. Para entender la posicin de forma
ms clara observemos la figura [3-56], en la cual aparece el nmero de la
columna en la parte superior.
Figura 3-55
Figura 3-56
Una vez establecidas cada una de las columnas que ocupan las variables,
debemos introducir en la vista previa de datos las lneas de corte
correspondientes al inicio y el final de cada variable de inters. Los datos
ubicados en las columnas 7 y 8, 11 a 27 y las superiores a 30 no se deben
considerar como informacin prdida, ya que estas columnas corresponden a
variables que no deseamos importar y por lo tanto las omitimos en la tabla
del diccionario de datos. Continuando con ejemplo, procedemos a introducir las
lneas de corte correspondientes a cada una de las variables de inters.
Para realizarlo, debemos insertar una lnea entre las columnas 4 y 5, otra entre
las columnas 5 y 6, otra entre las columnas 6 y 7, otra entre las columnas 8 y 9,
otra entre las columnas 10 y 11, otra entre las columnas 27 y 28, otra entre las
columnas 28 y 29, una ms entre las columnas 29 y 30 y la ltima lnea entre
las columnas 30 y 31; as mismo debemos borrar las lneas de las columnas
17, 24 y 32. Despus deingresar todas las lneas de corte, debemos obtener
los resultados de la figura [3-57].
Figura 3-57
Una vez definidas las lneas de corte para cada una de las variables hacemos
clic en Siguiente, con lo que aparece el cuadro de dilogo correspondiente al
paso 5 de 6 [Fig.3-58]. En este paso debemos definir el nombre y el formato de
cada una de las variables, as como especificar las variables que deseamos
importar.
Para poder utilizar las opciones Editar y Ejecutar es necesario haber definido y
guardado una consulta con anterioridad. Dado que es la primera vez que
trabajamos con archivos de base de datos debemos crear una nueva consulta,
por lo tanto escogemos la primera opcin, con lo cual se abre el cuadro de
dilogo correspondiente al Asistente para bases de datos [Fig.3-65], quien nos
guiar durante todo el proceso de definicin de los datos.
Este asistente se compone de seis pasos, a travs de los cuales se definen las
caractersticas de la informacin contenida en el archivo. En el primer paso
debemos especificar el origen o fuente de los datos; es decir, determinar el
nombre del archivo de inters y el programa que lo gener. Si nos fijamos en el
costado derecho del cuadro de dilogo, observaremos una lista de fuentes, en
donde aparecen todos los tipos de bases de datos con que cuenta nuestro
ordenador. Estos formatos son los accesos a los controladores de base de
datos que se encuentran instalados en el equipo.
Para especificar el origen de los datos, SPSS nos ofrece dos posibilidades; la
primera es aadir una nueva fuente de datos y la segunda es elegir una de las
fuentes existentes en el listado de formatos. A pesar que SPSS incluye dentro
del CD de instalacin, una gran cantidad de controladores (SPSS Data Access
Pack), es posible que no se encuentre dentro del listado
de formatos el controladorcorrespondiente al archivo de inters.
Para definir una nueva fuente de datos, debemos hacer clic en el botn Aadir
fuente de datos, con lo que surge un nuevo cuadro de dilogo denominado
Administrador de orgenes de datos ODBC [Fig.3-66]; esta aplicacin no hace
parte del paquete SPSS, sino que es una funcin del sistema operativo
Windows.
En este cuadro hacemos clic en el botn Examinar, con lo que surge una nueva
ventana de navegacin, por medio de la cual ubicamos el
archivoBasetelemerca.mdb en la carpeta Captulo3 incluida en el CD adjunto.
Despus de localizar el archivo, lo seleccionamos y hacemos clic en Abrir, de
manera que desaparece la ventana de navegacin y surge en la casilla Base
de datos la ruta de ubicacin del archivo. Para finalizar hacemos clic
en Aceptar apareciendo el cuadro de dilogo correspondiente al paso 2 de 6
[Fig.3-74]. En este paso debemos definir las variables de las
diferentes tablas del archivo que deseamos importar.
Figura 3-76
Por defecto el programa relaciona las variables que tengan el mismo nombre
en las dos tablas; las variables restantes deben ser relacionadas en
forma manual por el usuario. La utilidad de este paso radica en la posibilidad
de restringir dos variables con el mismo contenido pero con nombres diferentes
en las dos tablas.
La otra opcin que nos ofrece este paso la encontramos en la parte inferior del
cuadro y corresponde a Unir tablas automticamente. Esta opcin por defecto
se encuentra activa y su utilidad radica en formar como resultado un slo
archivo de datos. Dado que en nuestro caso las variables restantes no tienen
ningn tipo de relacin y la opcin unir tablas se encuentra activa,
hacemos clic en Siguiente con lo que aparece el cuadro de dilogo
correspondiente al paso 4 de 6 [Fig.3-79].
Figura 3-79
Teniendo en cuenta los valores que pueden tomar cada una de las variables, la
expresin debe quedar (IdTipoContacto > 1 AND Tipo de cuenta = COM). En
esta expresin, el conector AND acta como un limitante, ya que le indica al
programa que slo importe los casos que cumplan las dos condiciones; es
decir, nicamente importe los casos correspondientes a las empresas
comercializadores cuyo contacto no haya sido a travs de referidos.
Para continuar con el ejemplo, elegiremos la opcin Etiquetas de valor para las
variables Tipo de contacto, tipo de cuenta, Ciudad, Volumen y Cargo, para lo
que debemos hacer clic en la casilla que se ubica al costado de cada variable,
de manera que aparezca en la casilla un visto bueno ( ). Una vez activadas
las etiquetas de valor para las variables hacemos clic en Siguiente con lo que
aparece el cuadro de dilogo correspondiente al paso 6 de 6 [Fig.3-83], en
donde hallamos las opciones de resultados.
Este cuadro esta dividido en tres secciones; la primera corresponde a las lneas
de comando SQL que se han generado para el intercambio de informacin
desde la base da datos hasta SPSS. La segunda seccin corresponde a
las opciones deconsulta, en donde el asistente nos hace la pregunta Qu le
gustara hacer con esta consulta? y nos brinda la posibilidad de importar los
casos o pegar la sintaxis para modificarla posteriormente. Debemos recordar
que si le pedimos que pegue la sintaxis no importara los datos hasta que se
ejecute dicha sintaxis; para agilizarel proceso, seleccionamos la
opcin Recupere los casos.
Figura 3-84
Para finalizar con la importacin de archivos de bases de datos, vamos a
utilizar laconsulta que hemos guardado en el ltimo paso. Para realizarlo nos
dirigimos al men Archivo, escogemos la opcin Abrir base de datos y dentro
de ella seleccionamos la opcin Ejecutar consulta, con lo que se abre una
nueva ventana de navegacin [Fig.3-85].
Figura 3-85
Si nos fijamos en la casilla del nivel de medida, notaremos que junto a ella
se encuentra el botn Sugerir; al activar este botn, el programa nos brinda
una sugerencia sobre el nivel de medida ms adecuado para la variable
seleccionada, de acuerdo a los valores encontrados en la exploracin de los
datos.
Figura 3-91
Figura 3-92
Figura 3-93
Para finalizar la definicin de esta variable slo nos queda faltando la propiedad
Nivel de medida. Si hacemos clic en el botn Sugerir que se encuentra al
costado derecho de esta casilla aparece el cuadro de sugerencia [Fig.3-95]. En
este cuadro encontramos el nombre de la variable, el nivel de medida actual y
el nivel sugerido por el programa; generalmente cuando las variables son
categricas el programa no puede diferenciar entre Ordinal y Nominal por lo
que habilita una opcin de seleccin para cada una de las posibilidades, as
como una breve explicacin del porqu la variable debe ser categrica.
Una vez aclaradas las reglas que se deben seguir en la copia de propiedades,
continuamos con el ejemplo. Vamos a definir un archivo externo como origen
de la informacin de las propiedades, por lo que hacemos clic en el botn
Examinar. Al aparecer la ventana de navegacin, ubicamos
el archivo Datoscompleto.sav en lacarpeta Captulo3 del CD adjunto y
posteriormente hacemos clic en Abrir, con lo que la ventana de navegacin se
cierra y aparece en la casilla la ruta de ubicacin del archivo.
Para continuar hacemos clic en Siguiente, con lo que se obtiene el cuadro de
dilogo correspondiente al Paso 2 de 6 [Fig.3-103]. En este paso se define el
proceso que deseamos realizar y las variables que se involucrarn. Si nos
fijamos en la parte superior del cuadro, notaremos que aparecen tres diferentes
opciones de procedimiento.
Figura 3-103
Dado que por defecto el programa selecciona todas las propiedades y la opcin
reemplazar, no modificaremos nada y continuamos haciendo clic en Siguiente,
con lo que aparece el cuadro de dilogo correspondiente al Paso 4 de 5 [Fig.3-
105]. En este paso se definen las propiedades del conjunto de datos que se
copiaran del archivo externo.
Figura 3-103
Para esta labor SPSS cuenta con un procedimiento que nos permite congregar
informacin proveniente de diferentes archivos, con la condicin que el
proceso se realice en pares de ficheros; es decir, slo podemos reunir
informacin de dos archivos por cada proceso de fusin que se ejecute.
Para la unin de informacin, el procedimiento nos ofrece dos posibilidades, la
primera consiste en agregar los casos o respuestas de una fuente externa
dentro del archivo principal y la segunda consiste en importar las variables y
sus respectivas respuestas desde una fuente externa. Cada una de estos
procedimientos cuenta con unos criterios que se deben cumplir para su
correcto funcionamiento, los cuales conoceremos en los apartados siguientes.
Casar, esta opcin nos permite unir el contenido de dos variables con
diferentes nombres siempre que sean de archivos diferentes; generalmente la
utilizamos para definir una pareja de datos.
Indicar el origen del caso como variable; esta opcin genera una nueva variable
en el archivo de resultado, en donde ubicar un valor 0 a los casos del archivo
de trabajo y un valor 1 a los casos del archivo externo o secundario; adems
cuenta con una casilla para la asignacin del nombre de la variable de
identificacin.
Para continuar con el ejemplo, vamos a definir como una pareja las variables
NUMHAB y HABITANT, para realizarlo debemos seleccionar las dos variables
por lo que hacemos clic en una de las variables y luego hacemos (Ctrl + clic) en
la otra. Este mtodo es de bastante utilidad ya que generalmente aparece un
gran listadode variables desemparejadas y la seleccin de variables se hace
tediosa.
Para comprender los pasos que se deben ejecutar para la fusin de variables
de mltiples archivos, vamos a generar un ejemplo con los
archivos Hogar.sav yElectro.sav, incluidos en la carpeta Captulo3 del CD
adjunto. Estos archivos contienen la misma informacin del
archivo hogareste.sav utilizado en el ejemploanterior y la nica diferencia que
se puede destacar consiste en la presencia de la variable ID (Nmero de
identificacin), la cual es anexada en los dos archivos.
Para poder realizar la fusin de informacin cuando se tienen archivos con los
mismos Casos pero variables diferentes, es indispensable que los archivos
tengan en comn por lo menos una variable; es decir, debe existir una variable
con el mismo nombre y con los mismos valores en cada uno de los archivos, a
la cual el programa denomina Variable de Control. Adems de la variable de
control, SPSS tiene dos requerimientos que se deben cumplir antes de realizar
la fusin de los archivos:
Despus de comprobar que los archivos cumplen con los requerimientos del
programa, estamos listos para comenzar con la fusin de los archivos. En la
siguiente leccin continuaremos con la adicin de variables -
Procedimiento Aadir Variables de SPSS en Espaol.
La opcin ambos archivos facilitan casos nos permite indicarle al programa que
los dos archivos cuentan con casos nicos y por lo tanto no aparecen en el
otro; al seleccionar esta opcin es indispensable definirle al programa una
variable clave que le permita al archivo determinar el orden de emparejamiento
de los casos o de lo contrario no es posible realizar el procedimiento.
Es necesario resaltar que una tabla de claves o tabla de referencia, es un
archivo en el que los datos de cada "caso" se pueden aplicar a varios casos del
otro archivo de datos. Por ejemplo, si un archivo contiene informacin sobre los
diferentes miembros de la familia (como el sexo, la edad, la formacin) y el otro
contiene informacin global (como los ingresos totales, el nmero de
miembros o la ubicacin), se puede utilizar el archivo global como una tabla de
referencia y aplicar los datos comunes de la familia a cada uno de sus
miembros en el archivo fusionado.
Para continuar con el ejemplo activaremos la opcin Indicar el origen del caso
como variable, dejando estipulado el nombre Origen; sucesivamente
seleccionaremos la opcin Ambos archivos facilitan casos, por lo que
seleccionamos en la casilla de variables excluidas la variable ID y la
ingresamos en la casilla Variables clave; para realizarlo es necesario resaltar la
variable y posteriormente hacer clic en el botn flecha ( ) ubicado en la parte
inferior del cuadro, al costado izquierdo de la casilla variables clave, de manera
que obtenemos los resultados de la figura [3-121].
Para comprender los pasos que conlleva la depuracin de los datos, vamos a
realizar un ejemplo con el archivo Depu.sav, que se incluye en la
carpeta Captulo3del CD adjunto. Antes de iniciar el proceso de depuracin de
los datos, es necesario abrir el archivo en el editor de datos de SPSS, ya sea
mediante la rutaArchivo...Abrir...Datos o mediante el botn Abrir ( ) ubicado
en la barra de herramientas.
Una vez abierto notaremos que el archivo esta compuesto por las
variables ID(Nmero de encuesta), Gnero (Sexo del
encuestado), Estciv (Estado civil) y Edad(Edad del encuestado) [Fig.3-123]. Es
de gran importancia tener una idea de los datos que contienen el archivo para
poder optimizar el proceso de depuracin.
Figura 3-125
Figura 3-126
Figura 3-127
Una vez se han detectado los valores errneos, debemos ubicar los casos a los
que pertenece cada uno de ellos. Los metodos empleados para ubicar los
casos de origen los veremos en la siguiente leccin.
Figura 3-128
Para activar esta ventana, debemos hacer clic sobre el nombre de la variable
en la que deseamos realizar la bsqueda, de manera que el nombre de la
variable aparezca en la parte superior del cuadro. Una vez se activa,
ingresamos el valor que deseamos localizar en la casilla Buscar qu y
sucesivamente hacemos clic en el botn Buscar siguiente, de manera que el
cursor se ubica en el primer caso en el que encuentre el valor definido; si
volvemos a presionar el botn, el programa pasar al siguiente caso que
concuerden con el valor definido.
Estos catorce casos corresponden al nmero de valores tres (3) que nos
indicaba la tabla de frecuencias. Es de gran importancia anotar el nmero del
caso, para poder determinar la encuesta a la que corresponde. En nuestro
archivo, el nmero de encuesta coincide con el nmero de fila, por lo que ya
tenemos los nmeros de los formularios en que debemos buscar los errores.
Esta expresin nos garantiza que los valores cero sern seleccionados;
paracontinuar debemos seleccionar en la calculadora el conector logico O ( |
). Sucesivamente ingresamos la expresin del segundo nmero (Estciv = 7),
con lo que obtenemos en la casilla de expresin la ecuacin (
). En este caso el conector O lgico, le informa al programa que seleccione
los casos que cumplan con una de las expresiones que aparecen antes y
despus del conector.
Figura 3-136
Figura 3-137
Para poder identificar las encuestas (Casos) que contienen valores errneos,
es necesario generar una tabla de frecuencias para la variable Nmero de
encuesta (ID); para realizarlo nos dirigimos a la barra de herramientas y
seleccionamos el botn Recuperar cuadros de dilogo ( ). Al hacer clic sobre
l, aparece un listadode los cuadros de dilogo de los procedimientos que se
han ejecutado en el programa, de acuerdo al orden inverso de utilizacin; es
decir, el ltimo procedimiento realizado aparece en la primera posicin [Fig.3-
139].
Figura 3-141
Figura 3-137
Una vez detectados los valores correctos, debemos volver al editor de datos y
corregir cada uno de los casos. Despus de efectuar la correccin es necesario
guardar los cambios realizados antes de comenzar con el anlisis de la
informacin. Hay que notar que el procedimiento Seleccionar casos slo es
efectivo cuando existe una variable de identificacin dentro de los datos; por
este motivo es recomendable generar una variable de identificacin en el
momento que se crean los archivos.
Gnero = (1, 1, 2, 2, 2, 3, 3, 3, 3, 3)
Si asumimos que los valores 3 son mujeres el resultado seria que el 80% de los
entrevistados son mujeres y si tomamos el valor 3 como hombre obtendramos
que el 70% de los entrevistados son hombres, en ambos casos estaramos
cometiendo un error y los resultados del anlisis van a salir distorsionados.
A simple vista los resultados no son tan graves pero si asumimos que esta
informacin proviene de una encuesta realizada por una empresa que se
dedica a la fabricacin y comercializacin de maquinas de afeitar y este gnero
representa los compradores habituales del producto; el asumir que los valores
3 son mujeres nos indicara que nuestros usuarios son las mujeres y por tanto
deberamos dirigir todos nuestros esfuerzos de mercadotecnia hacia este
sector, lo cual podra causar serios problemas en las ventas de la empresa.
CAPITULO IV
Figura 4-1
Despus asignarle el nuevo nombre slo nos resta elegir una de las opciones
delorden de recodificacin que en nuestro caso ser Menor valor [Fig.4-4]; para
finalizar hacemos clic en el botn Aceptar, con lo cual la nueva variable se
genera en la parte final del editor de datos [Fig.4-5]. Esta variable se conforma
con los valores uno (1) para el gnero Femenino y dos (2) para el
gnero Masculino.
Figura 4-6
En conclusin la Recodificacin automtica nos permite cambiar los valores de
una variable numrica o de cadena por valores enteros consecutivos, lo cual
nos garantiza que se pueden realizar clculos estadsticos con esta
informacin. Esteprocedimiento es ideal para la transformacin de las variables
de cadena a variables numricas, ya que el programa convierte los antiguos
valores de la variable de origen en etiquetas de valor para la variable
de resultado. Es necesario destacar que el procedimiento se efecta en orden
alfabtico y las maysculas tienen prelacin a las que comienzan con
minsculas.
En resumen, los pasos que se deben ejecutar para realizar una recodificacin
automtica son:
Activar el procedimiento [en el men Transformar seleccionamos la
opcin Recodificacin automtica].
Seleccionar la (s) variable (s) [en el listado de variables escogemos las
variables de inters y las ingresamos a la casilla de seleccin;
generalmente son variables con caracteres alfanumricos].
Definir el nombre de la (s) variable (s) de destino [seleccionar la variable
de inters e ingresar el nombre en la casilla; para finalizar hacer clic en el
botn Aadir nuevo nombre].
Definir el orden de recodificacin [Activar alguno de los mtodos de
ordenamiento Menor valor Mayor valor]
Ejecutar la recodificacin automtica [Hacer clic en el botn Aceptar].
Para esta labor, SPSS cuenta con el procedimiento Categorizar Variables (Slo
versiones anteriores a la 12.0), el cual convierte los datos de una variable de
escala (Valores numricos que representan cantidad), en un nmero discreto
de categoras; es decir, rene un grupo de valores y les asigna un nmero
representativo de categora de pertenencia. Los nuevos valores son guardados
en una nueva variable la cual se identifica con el nombre original precedido de
la letra ene (n); por ejemplo la variable Altura al ser categorizada
quedara naltura. Si cuentas con la versin 12.0 omite este apartado y pasa al
siguiente, ya que esta nueva versin (12.0), cuenta con un procedimiento de
categorizacin mejorado, que nos ofrece mayor asistencia.
Para realizarlo, debemos ubicar cada una de las variables dentro del listado e
ingresarlas a la casilla de seleccin haciendo clic en el botn Flecha ( ). Una
vez ingresadas las variables, slo nos resta definir el nmero de categoras que
aparecern en las variables de resultado, que para el caso corresponde a cinco
(5). Para definir la cantidad de categoras, activamos la casilla haciendo clic
sobre ella y sucesivamente introducimos el nmero cinco [Fig.4-9]. Para
finalizar hacemos clic en el botn Aceptar, con lo que las variables aparecen en
la parte final del editor de datos [Fig.4-10].
Figura 4-11
Figura 4-12
En conclusin el procedimiento categorizar variables nos permite convertir
rpidamente una variable de Escala en una variable Ordinal, con la desventaja
que desconocemos los valores que involucra cada uno de los rangos; su
utilidad radica en la capacidad de organizar cada uno de las categoras con un
valor porcentual aproximadamente igual.
En resumen, los pasos que se deben ejecutar para categorizar variables son:
Este nuevo procedimiento nos ofrece varias alternativas para determinar los
lmites de cada grupo, ya sea por medio de intervalos de igual amplitud,
porcentajes o desviaciones tpicas. A travs de este nuevo procedimiento se
puede realizar lasopciones:
Figura 4-15
Este cuadro esta compuesto por mltiples secciones, cada una de ellas cumple
un objetivo especfico dentro de la definicin de los conjuntos de agrupacin.
La primera seccin del cuadro corresponde a la lista de variables [Fig.4-16]; en
esta casilla aparecen las variables que fueron seleccionadas en el cuadro de
dilogo inicial. Este listado se puede ordenar de acuerdo al nivel de medida
(de Escala uOrdinal) o por el nombre de las variables; pulsando en los
encabezados de las columnas Medida y Variables.
Figuras 4-16 y 4-17
Figura 4-18
Figura 4-19
Puesto que los valores de la nueva variable slo sern nmeros enteros
consecutivos, las etiquetas de valor surgen como una opcin bastante til,
sobre todo en los resultados de los procedimientos que se realicen con esta
nueva variable, ya que le proporciona al usuario orientacin sobre los rangos
que componen cada intervalo. Las etiquetas pueden ser introducidas
manualmente o mediante la opcin Crear etiquetas, con lo que se generan de
forma automtica.
Figura 4-20
Figura 4-23
Figura 4-24
El categorizador visual nos ofrece dos formas para generar los intervalos
(Manual o Automatico); para la variable Educaos, vamos a emplear el
mtodo manual, por lo que debemos asignar los rangos antes de introducir
los puntos de corte superior. Dado que esta variable representa los aos de
educacin con que cuenta cada uno de los entrevistados, vamos a crear
tres rangos; el primero rene toda la educacin
Bsica (Primaria, Secundaria y Preparatoria), para este nivel se requiere
cursar once aos (11).
Figura 4-29
Despus de definir los puntos de corte, slo nos resta asignar el nombre y la
etiqueta a la nueva variable, para facilitar el reconocimiento de esta variable,
le asignaremos el nombre Rangeduc y la etiqueta Rangos de Educacin.
Figura 4-30
Figura 4-31
Figuras 4-35
Despus de definir los puntos de corte hacemos clic en Aplicar, con lo que
surge el aviso Se reemplazarn las definiciones de los puntos de corte
existente. Una vez hacemos clic en Aceptar, se cierra el cuadro y los valores
de cada punto aparecen en la columna Valor de la seccin Rejilla [Fig.4-37].
Si nos fijamos en los puntos de corte superior, notaremos que slo uno de
ellos cambia con respecto al mtodo anterior; en esta oportunidad el
primero de los puntos se ubica en el valor 25.
Figura 4-37
En la siguiente leccin conoceremos el ultimo metodo empleado para
asignar lospuntos de corte del Categorizador Visual de SPSS.
Figuras 4-38
Si no se selecciona ninguna de estas opciones, el programa genera slo dos
intervalos; el primero va desde el menor valor hasta la media y el segundo
desde el valor siguiente a la media hasta el mximo valor. Este mtodo nos
permite seleccionar cualquier combinacin de las opciones (1 y 2, 2 y 3, 1 y 3
1 2 y 3, etc.). Por cada opcin que se seleccione obtendremos dos intervalos
ms. Por ejemplo si seleccionamos las opciones 1 y 2 obtendremos seis
intervalos.
Figura 4-39
Para finalizar con la variable Edad, slo nos resta definirle un nombre a la
nueva variable, que en nuestro caso corresponde a Edadcat. Despus de
definir el nombre, seleccionamos la variable categrica (Ordinal) Condicin de
salud (Consalud), de manera que el contenido del cuadro se actualiza y nos
muestra losresultados de la exploracin.
Esta variable tiene cinco diferentes categoras [Fig.4-41], las cuales pueden ser
reunidas en tres. Para realizarlo, vamos a unir las categoras Buena y
Relativamente buena, as como Relativamente mala y Mala, de manera
que obtengamos las categoras Excelente, Buena y Mala. Si nos fijamos en el
histograma de esta variable [Fig.4-42], notaremos que el valor perdido nueve
(9), no aparece; esto se debe a que se defini en las propiedades de variables
este valor como perdido.
Figura 4-29
Para categorizar esta variable, slo necesitamos ingresar los puntos de corte
Cero (Excelente) y 2 (Buena), con lo que obtenemos los resultados de la figura
[4-43]. Si nos fijamos en las etiquetas, notaremos que el primer intervalo slo
cobija los valores Cero equivalentes a la categora Excelente; a su vez, el
segundo intervalo agrupa los valores uno y dos, correspondientes a Bueno y
Relativamente bueno y el tercer intervalo (Superior), agrupa los valores tres y
superiores, lo que nos indica que agrupa las categoras Relativamente
mala y Mala. Para terminar debemos definir las etiquetas correctas para cada
valor [Fig.4-44] y asignarle un nombre a la nueva variable que en este caso
ser Salud.
Figura 4-45
Si nos fijamos en la vista de datos del editor [Fig.4-46], notaremos que las
nuevas variables apareen al final del archivo. Cada una de estas variables se
define comoOrdinal [Fig.4-47] y a su vez adquiere los valores perdidos que se
hayan definido para la variable de origen, as mismo las etiquetas de valor
definidas en elprocedimiento, sern anexadas a las variables de resultados;
para comprobarlo, basta con activar el botn Etiquetas en la Vista de datos.
Dado que la diferencia en los cuadros de dilogo de estas dos opciones es muy
pequea, elegiremos la opcin correspondiente a En distintas variables. Al
hacer clic en ella, aparece el cuadro de dilogo correspondiente a Recodificar
en distintas variables [Fig.4-49]; este cuadro contiene los elementos habituales
de los cuadros de dilogo, como la lista de variables y la casilla de seleccin,
pero adems incluye tres secciones adicionales denominadas Variable de
resultado, Valores antiguos y nuevos y Condicional.
Figura 4-50
Perdido por el usuario: son observaciones que tienen valores que han sido
declarados como perdidos por el usuario. Generalmente
estos valores representan razones por las cuales no se tiene informacin
como por ejemplo No Sabe, No Responde, No Aplica. Estos valores son
definidos por el paquete como MISSING.
Figura 4-52
Figura 4-53
Figura 4-54
Continuando con la recodificacin, slo nos basta finalizar con el tercer nivel de
trabajo, por lo que activamos la primera opcin de rango (Desde / Hasta), e
ingresamos en la primera casilla el nmero 6 y en la segunda casilla el nmero
7;sucesivamente ingresamos en la casilla valor de la seccin Valor nuevo el
nmero 3 y posteriormente hacemos clic en el botn Aadir, con lo que
aparece en ellistado la frase (6 thru 7 3) [Fig.4-56].
Figura 4-56
Para utilizar una expresin condicional debemos hacer clic en el botn SI... del
cuadro de dilogo principal. Al hacer clic en l, aparece un nuevo cuadro de
dilogo correspondiente a Si los casos [Fig.4-57]; este cuadro nos permite
aplicar transformaciones de los datos para subconjuntos de casos
seleccionados por medio de expresiones condicionales. Una expresin
condicional devuelve un valor verdadero, falso o perdido para cada caso. Si
el resultado de una expresin condicional es verdadero, la transformacin se
aplicar al caso. Si el resultado de una expresin condicional es falso o
perdido, la transformacin no se aplicar al caso.
Figura 4-57
Este cuadro de dilogo esta dividido en las secciones Lista de variables, Zona
de ecuacin (en esta casilla se ingresa la expresin de condicin), Calculadora
de SPSS (ver Depuracin Capitulo III) y las posibilidades de seleccin donde
encontramos la posibilidad de escoger las opciones Todos los casos (Aplica la
transformacin a todos los casos) o la opcin Incluir si el caso satisface la
condicin (Aplica la transformacin slo a los casos que cumplen las
condiciones especificadas en la expresin).
Una vez definidos todos los parmetros del procedimiento, hacemos clic en el
botn Aceptar con lo que se ejecuta la recodificacin y la variable de resultado
aparece en la parte final del editor de datos de SPSS [Fig.4-59].
Esta variable contendr slo los niveles del rea de trabajo de los casos que
pertenezcan al gnero masculino; para los casos pertenecientes al gnero
Femenino se le asignan valores perdidos por el sistema; es decir, aparece un
espacio en blanco (. ). A cada nueva variable generada por la Recodificacin se
le debe definir las propiedades por medio de la pestaa vista de variables o
elprocedimiento Definir propiedades de variables, ya que por defecto el
programa las crea sin propiedades.
Figura 4-61
La nica diferencia que se puede establecer entre las dos opciones radica en la
seccin Variable de resultado que se incluye en el cuadro de dilogo
delprocedimiento En distintas variables. Esta diferencia se debe a que la
segunda opcin (En distintas variables), guarda los cambios realizados en una
nueva variable, mientras que la primera opcin (En las mismas variables)
reemplaza los valores dentro de la variable original.
Cada una de las secciones que tienen en comn estos dos cuadros, funcionan
de forma idntica; es decir, la definicin de los parmetros de la recodificacin
se realiza de la misma forma en los dos procedimientos; con la nica diferencia
que para la primera opcin no es necesario definir el nombre y la etiqueta de la
variable de resultado. Desde luego es recomendable emplear siempre que sea
posible laRecodificacin en distintas variables, ya que es posible que se
necesite trabajar con los valores originales en otro momento del anlisis.
Este procedimiento genera un valor por cada uno de los casos, el cual
representa el nmero de veces que se encontr el valor especificado dentro
del total de las variables; el mximo valor que puede tomar este parmetro
es igual a la cantidad de variables del conjunto. Por ejemplo si tomamos 5
variables, el valor mximo de apariciones por caso ser el nmero 5 y el
valor mnimo ser el nmero 0.
Figura 4-64
Por ltimo podemos ingresar una restriccin a los casos que deseamos
contar, haciendo clic en el botn (Si...); note que este cuadro es similar al
explicado en el apartado anterior. En esta seccin debemos ingresar la
expresin condicional con la que se realiza la seleccin de casos.
Este cuadro esta compuesto por las secciones tradicionales del programa
como la lista de variables y la casilla de seleccin (Expresin Matemtica), as
como tambin la calculadora de SPSS (Ver depuracin Captulo III) y la
Condicional. La nica seccin nueva que aparece en este cuadro corresponde
a Variable de destino, en la cual se definen el nombre, la etiqueta y el tipo de
datos de la variable de resultado.
Figura 4-68
Figura 4-69
Figura 4-70
Debemos tener en cuenta que el procedimiento calcular no se puede realizar
cuando contamos con valores perdidos por el sistema ( . ) dentro de las
variables, ya que cualquier operacin aritmtica que se realice con un valor
perdido da como resultado un valor perdido; es decir, cualquier clculo (suma,
resta, divisin, multiplicacin, etc) realizado entre un valor numrico y un valor
perdido por el sistema, da como resultado un valor perdido por el sistema; es
por este motivo que en las variables (Ven1tri, Ven2tri, Ven3tri y Ven4tri),
encontramos valores cero (0) en vez de valores perdidos por el sistema.
Dentro del archivo Satisfaccin se han incluido las variables (Satemp, Satsuel,
Satentor, Satcompa, Sattraba, Satjefe y Satbene); las cuales contienen nivel de
confianza o satisfaccin de los empleados de la empresa Dkf Tradiccin. Esta
informacin representa las respuestas de cada uno de los encuestados a
lapregunta Qu grado de satisfaccin le merecen los siguientes parmetros
de la compaia?, la Empresa, el Salario remunerado, su Entorno de trabajo,
sus Compaeros de trabajo, Su trabajo, Su jefe y los beneficios de la empresa
(Salud, pensin, cesantas, etc). En donde el valor uno (1) representa la
mnima satisfaccin y el valor diez (10) la mxima.
La otra posibilidad que se presenta en los clculos con los valores perdidos es
ocasionada por los valores perdidos por el sistema, en cuyo caso las
operaciones (aritmticas, lgicas, exponenciales, etc), generan como resultado
otro valor perdido por el sistema el cual se representa con un punto ( . ). Es
decir, si dentro de las respuestas de un encuestado encontramos los valores
(8, 10, 10, 9, 7, 6 y . ); al emplear la ecuacin inicial obtendremos como
resultado un valor perdido por el sistema ( . ).
Debemos recordar que los valores perdidos definidos por el usuario son
razones por las cuales no se obtuvo una respuesta coherente con el rango de
posibilidades validas, como No sabe, No responde No aplica; mientras que
los valores perdidos por el sistema son la ausencia total de un valor y pueden
ser ocasionados por errores de digitacin o de captura, por lo que es
recomendable revisarlos en el momento de realizar la depuracin de los datos
(ver Capitulo III).
Figura 4-71
Figura 4-73
Para crear una nueva variable que contenga el nmero de respuestas validas
de cada uno de los encuestados, debemos ir al men Transformar y
seleccionar el procedimiento Contar apariciones, con lo que aparece el cuadro
de dilogo correspondiente [Fig.4-74]. En este cuadro definimos el nombre de
la variable de resultado y la etiqueta, que para el caso sern resval y Nmero
de respuestas validas respectivamente.
Figura 4-74
Hasta este momento slo hemos corregido los problemas que presentaba la
ecuacin inicial, los cuales pueden ocasionar serios inconvenientes en el nivel
general de satisfaccin. Una vez corregidos estos factores la ecuacin queda:
Todos los procedimientos estadsticos con que cuenta SPSS se encuentran ubicados en el
men Analizar. Al hacer clic en l aparece una lista desplegable [Fig. 5-4], en la cual se pueden
observar los diferentes procedimientos con que cuenta el programa, como Informes,
Estadsticos descriptivos, Tablas, Comparar medias, Modelo lineal general, Modelos mixtos,
Correlacin, Regresin, Loglineal, Clasificar, Reduccin de datos, Escalas, Pruebas no
paramtricas, Series temporales, Supervivencia, Respuestas mltiples, Anlisis de valores
perdidos y Muestras complejas
1. FRECUENCIAS
Este procedimiento nos permite analizar de forma descriptiva las variables
Categricas o de Escala, mediante la generacin de tablas de frecuencia,
Grficos y una amplia gama de estadsticos como las medidas de tendencia
central, de Dispersin y de Distribucin. Adems nos permite organizar los
resultados de forma ascendente o descendente ya sea por sus valores o
sus frecuencias.
Figura 5-5
En este cuadro encontramos las diferentes medidas estadsticas delprocedimiento, como las
medidas de tendencia central (Media, Mediana, Moda y Suma), medidas de posicin no central
(Cuartiles, puntos de corte y percentiles), medidas de dispersin (Desviacin estndar,
Varianza, Amplitud o rango, Mnimo, Mximo y el Error tpico de la media) y medidas de
distribucin (Asimetra y Curtosis). Adems encontramos una casilla en la cual podemos
informarle al programa que los valores representan puntos medios de grupos; es decir, que los
valores de la variable representan el punto medio de los datos agrupados.
Dado que la mayora de los estadsticos que comprende este cuadro de dilogo han sido
explicados en los apartados anteriores, slo haremos referencia a lasmedidas de posicin no
central. Estas medidas nos permiten conocer el valor que se encuentra o representa una
posicin especfica dentro de los datos. Supongamos que contamos con 100 datos, cuyos
valores varan entre 1 y 100; si le pedimos al paquete que nos indique el valor de los cuartiles,
el programa nos ensear los valores que se encuentren en las posiciones equivalentes al
25%, 50% y 75% de los datos, que para el caso seran los valores (25, 50 y 75)
respectivamente.
Por el contrario, los Percentiles nos permiten conocer los valores que se encuentran en un
porcentaje especfico de los datos; es decir, nos permite saber que valor se encuentra en la
posicin que nosotros deseemos conocer, sin importar si se trata de un porcentaje entero o
fraccional (Ej:18.75, 19.25, 20, etc). Desde luego estas posiciones no deben superar la cifra de
cien, ya que para su clculo se toma la totalidad de los datos validos como el global del
porcentaje; es decir, el 100%.
Por ltimo, encontramos la opcin Puntos de corte para [XX] grupos iguales, en donde
podemos pedirle al paquete que divida la informacin en un determinado nmero de grupos
con igual porcentaje de casos. Esta opcin nos ofrece como resultado los percentiles de corte
(Porcentajes) de cada uno de los grupos y nos indica a su vez el valor que se encuentra en
cada punto. La nica restriccin que presenta esta opcin, corresponde a que el nmero
mximo de grupos que podemos obtener es de 100.
En conclusin las medidas de posicin no central nos permiten identificar los valores que se
encuentran en las posiciones o porcentajes que deseemos conocer, siendo las ms empleadas
los Cuartiles (25%, 50% y 75%).
La ltima eleccin que nos ofrece este nuevo cuadro corresponde a Los valores son puntos
medios de grupos, con la cual le podemos especificarle al paquete que los datos recolectados
en la variable han sido previamente agrupados y sus valores representan el punto medio de
cada uno de los rangos agrupados. Debemos recordar que las ecuaciones de cada una de las
medidas estadsticas difieren s los valores son agrupados con anterioridad.
Para emplear cualquiera de los estadsticos del procedimiento Frecuencias, slo basta con
activarlo haciendo clic sobre la casilla que se encuentra a la izquierda de cada medida, de
manera que aparezca en ella un visto bueno ( ). Podemos seleccionar todos los estadsticos
que deseemos, teniendo como nica limitante el nivel de medida de cada variable. Por el
momento, continuaremos con el recorrido de los diferentes elementos del procedimiento, por lo
que no seleccionaremos ninguno de los estadsticos y en cambio hacemos clic en el
botn Cancelar, con lo que volvemos al cuadro de dilogo Frecuencias.
La segunda opcin del procedimiento frecuencias corresponde a Grficos. Al hacer clic sobre el
botn grficos, aparece el cuadro de dilogo correspondiente aFrecuencias: Grficos [Fig.5-7].
En este cuadro encontramos los tres diferentes tipos de grficos con que cuenta
el procedimiento, como los son el grfico de barras, el grfico de sectores y el histograma.
Adems, a travs de este cuadro podemos escoger si las porciones de los grficos representan
un recuento de los casos (Frecuencias) el porcentaje al que equivale.
Por defecto el programa tiene activada la opcin Ninguno. La seccin valores delgrfico slo se
activa cuando se selecciona uno de los grficos de barras o de sectores y a su vez la casilla
de curva normal slo se activa cuando se selecciona el Histograma [Fig.5-8]. Para comprender,
la esencia de cada uno de estos mtodos de representacin grfica, en la siguiente leccin
vamos a realizar una pequea explicacin de sus elementos y usos.
1. Grfico de Barras
Este tipo de grfico nos permite identificar y comparar de forma visual
elcomportamiento de las categoras de una variable. Por medio de las
barras podemos conocer aspectos de forma sencilla de una o varias
variables, como lo pueden ser sus categoras, las frecuencias y las
diferencias entre ellas. Laestructura bsica de un grfico de barras [Fig.5-9],
esta basado en un eje de categoras generalmente el eje horizontal y un eje
de frecuencias que en algunos casos puede ser remplazado por el
porcentaje. Adems se suelen utilizar diferentes colores para cada una de
las categoras facilitando el reconocimiento por parte delusuario.
Figura 5-9
Los grficos de barras tambin son tiles para comparar varias variables a la vez [Fig.5-10].
Este tipo de opciones implica una serie de tcnicas como la anidacin y la agrupacin las
cuales sern expuestas en el captulo siete.
Figura 5-10
2. Grfico de Sectores
Los grficos de sectores o de torta nos permiten observar la variable de forma global haciendo
una comparacin inmediata del porcentaje o la frecuencia del total de las categoras de una
variable. Su utilidad radica en la facilidad para interpretar la informacin contenida en una
variable mediante la representacin grafica de los resmenes (Porcentajes o Frecuencias).
Figura 5-11
La estructura bsica de los grficos de sectores [Fig.5-11], esta definida por un crculo en el
cual se representan cada una de las categoras por la porcin o fraccin correspondiente al
porcentaje o la frecuencia. En algunas ocasiones suelen separarse las fracciones, con el fin de
hacer ms clara la informacin.
3. Histograma
Los histogramas nos permiten identificar diversos parmetros como la dispersin, la
distribucin y la concentracin de los datos en una variable de Escala. Este tipo de grficos
generan una representacin visual del comportamiento de los datos,
permitiendo observar rasgos caractersticos como la zona o rango de mayor concentracin, la
amplitud, los valores extremos, etc.
La estructura bsica de un histograma [Fig.5-12], esta basada en rangos, los cuales suelen ser
representados por barras cuya altura es determinada por la cantidad de valores que se
encuentren dentro de los lmites de cada rango (Frecuencia). Generalmente se utiliza el Eje
vertical para representar las frecuencias y el Eje horizontal para los rangos; adicionalmente se
puedesobreponer una Curva Normal con el fin de comparar si los datos tienden a distribuirse
de forma uniforme.
Figura 5-12
En resumen cuando se trabaja con variables categricas (Nominal u Ordinal), los grficos ms
indicados y representativos en su anlisis descriptivo corresponden a los grficos de Barras y
los de Sectores; por el contrario si se trata de una variable de Escala el grfico ms apropiado
es el Histograma.
Dado que por el momento slo estamos haciendo un recorrido por las opciones del
procedimiento Frecuencias, no seleccionaremos ninguno de los grficos y en cambio hacemos
clic en el botn Cancelar, con lo cual volvemos al cuadro de dilogo principal del
procedimiento. En la siguiente leccion conoceremos la ultimaopcion del procedimiento
Frecuencias denominada Formato.
En resumen esta opcin nos permite agrupar los resultados de todas las
variables por cada uno de los procedimientos (Frecuencias, Estadsticos y
Grficos). Si por el contrario seleccionamos la opcin Organizar resultados
segn variables, el programa nos ensea todos los resultados de cada
variable antes de mostrar los resultados de la siguiente; es decir, nos
ensea la tabla de frecuencias, los estadsticos y el grfico de la primera
variable, a continuacin nos ensea los resultados de la segunda y as
sucesivamente hasta terminar con cada una de las variables seleccionadas.
Desde luego es apenas logico que una tabla que nos informa que dentro de
los encuestados aparecen 20 con 18 aos de edad, 32 con 19 aos de edad
y as sucesivamente hasta llegar al valor mximo, no es de gran utilidad.
Para facilitar la interpretacin de este tipo de informacin es mejor crear
una nueva variable y codificar estas edades dentro de rangos y
sucesivamente realizar la tabla de frecuencias a esta nueva variable de
edad categorizada.
Despus de seleccionar las medidas estadsticas hacemos clic en el botnContinuar con lo que
volvemos al cuadro principal del procedimiento Frecuencias. Para continuar seleccionamos el
botn Grficos con lo que aparece el cuadro de dilogo respectivo [Fig.5-17]; a travs de este
cuadro seleccionaremos la opcin Grafico de barras, teniendo en cuenta definir en la seccin
valores del grfico la opcin frecuencias y posteriormente hacemos clic en el botn Continuar,
con lo que volvemos al cuadro de dilogo principal.
Figura 5-17
Por ltimo activamos el botn Formato con lo que aparece el cuadro de dialogo
correspondiente [Fig.5-18], en donde seleccionamos las opciones Valores
ascendentes y Comparar variables. Una vez activadas estas opciones, hacemos clic en el
botn Continuar con lo que volvemos al cuadro de dilogo principal
delprocedimiento Frecuencias.
Figura 5-18
Hasta este momento todo lo que hemos hecho es pedirle al programa que nos realice
las tablas de frecuencia de las variables ESTCIV y NIVEDUC, as como las medidas de
tendencia central Mediana y Moda, un grfico de barras para cada una de ellas y que organice
los resultados de acuerdo a los valores que se establecieron en las propiedades de las
variables, asi como que exponga los resultados de forma comparativa; es decir, nos ensee
las tablas de frecuencia de las dos variables y sucesivamente los grficos. Para finalizar y
observar los resultados debemos hacer clic en el botn Aceptar con lo que los efectos
delprocedimiento aparecen en el visor de resultados [Fig.5-19].
Figura 5-19
Figura 5-20
Figura 5-21
Figura 5-22
SPSS nos permite modificar algunos de los parmetros de cada uno de los
grficos como lo puede ser la forma de las barras, el color, la trama de
relleno, la organizacin, etc. Por el momento no profundizaremos en estos
temas ya que sern explorados con mayor profundidad en l captulo 7.
Figura 5-23
Una vez que hemos abierto nuevamente el cuadro de dilogo del procedimientoFrecuencias,
hacemos clic en el botn Restablecer con lo que todas las opciones seleccionadas
anteriormente se desactivarn. Al igual que con las variables categricas, lo primero que
debemos efectuar es definir las variables a las que le realizaremos el anlisis, que en nuestro
caso son Edad y Educaos, por lo que debemos ubicarlas en la lista de variables y llevarlas a
la casilla de seleccin, ya sea haciendo doble clic sobre ellas o a travs del botn flecha ( );
posteriormente debemos desactivar la opcin Mostrar tablas de frecuencias, con lo que
aparecer el mensaje [Fig.5-24]. Ha desactivado todos los resultados. A menos que solicite
Mostrar tablas de frecuencias, Estadsticos o Grficos, FRECUENCIAS no generar
ningn resultado.
Figura 5-24
Este mensaje se debe a que por defecto el procedimiento Frecuencias slo realiza
las tablas de frecuencia y a menos que se le especifique opciones como los estadsticos o los
grficos, no producir ningn resultado. Al hacer clic en Aceptarse desactivar la
opcin Mostrar tablas de frecuencia con lo que garantizamos que sean excluidas de los
resultados [Fig.5-25]. Para comprobar que han sido desactivadas las tablas de frecuencia,
debemos fijarnos en la casilla de seleccin que aparece al costado izquierdo de la opcin y
notar que haya desaparecido el visto bueno ( ).
Figura 5-25
Figura 5-26
De las medidas de posicin no central escogemos nicamente los Cuartiles (Porcentajes 25, 50
y 75); adicionalmente, en las medidas de posicin central seleccionamos la Media,
la Mediana y la Moda; a su vez, en las medidas de distribucin seleccionamos la Asimetra y
la Curtosis y por ltimo en las medidas de dispersin activamos la Desviacin tpica,
la Varianza, la Amplitud, el Mximo, el Mnimo y el error tpico de la media.
Debemos recordar que para poder establecer si una medida ha sido activada, debe aparecer
en la casilla de seleccin ubicada al costado izquierdo de la medida un visto bueno ( ).
Despus de seleccionar correctamente cada una de las opciones hacemos clic en el
botn Continuar con lo que volvemos al cuadro de dilogo principal.
Una vez especificados los estadsticos debemos definir el tipo de grfico que deseamos
obtener, para lo que hacemos clic en el botn Grficos, de tal manera que aparece el cuadro
de dilogo correspondiente a Frecuencia: Grficos [Fig.5-27].
Figura 5-27
En la siguiente leccin continuaremos definiendo las opciones del procedimiento y veremos los
resultados del procedimiento Frecuencias en variables de Escala.
Por el momento reuniremos todos los estadsticos en una sola tabla por lo
que mantendremos la opcin por defecto del programa (Compara variables).
Para proseguir hacemos clic en Continuar, volviendo al cuadro de dilogo
principal. Despus de definir todas las propiedades del procedimiento,
hacemos clic enAceptar con lo que se realizarn los clculos y los efectos
son expuestos en el visor de resultados de SPSS.
Figura 5-29
Si ahora nos fijamos en los grficos [Fig.5-30], notaremos que cada uno de
ellos cuentan con las mismas caractersticas de los grficos de barras
utilizados en las variables categricas; es decir, las frecuencias se ubican
en el eje vertical (Eje Y) y los rangos en el eje horizontal (Eje X). Adems,
este tipo de grficos incluye otros datos como la Media, la Desviacin
tpica y el nmero de respuestas validas quien es representado por la letra
ene (N); as mismo se incluye una curva normal para identificar la
distribucin de los datos.
Figura 5-30
Estas grficas son particularmente tiles ya que con ellas podemos saber si
los datos se agrupan en un punto especfico o si por el contrario su
agrupacin no es constante, por lo cual se suelen presentar una elevado
nmero de rangos. Debemos recordar que los histogramas son un apoyo
visual a los resultadosmatemticos y que su funcin es generar una idea
visual del comportamiento de los datos.
Una vez seleccionadas las opciones hacemos clic en el botn Continuar con
lo que volveremos al cuadro de dilogo principal. Para finalizar hacemos clic
en el botnAceptar con lo que se realizan los clculos de las medidas y las
conclusiones son expuestas en el visor de resultados de SPSS [Fig.5-35].
Figura 5-35
Por defecto, el programa genera una sola tabla en la que incluye los
resultados de todas las variables seleccionadas. Si nos fijamos en los
resultados notaremos que la tabla se extiende en forma horizontal debido a
que ahora las variables se ubican en las filas y los estadsticos en las
columnas, lo cual nos impide observarla en su totalidad, para poder tener
una mejor comprensin de los resultados, en la siguiente leccion vamos a
cambiar el eje en el que se encuentran cada uno de los factores, es decir
vamos a ubicar las variables en el eje vertical y los estadsticos en el eje
horizontal, con lo que podremos mejorar la percepcin de los resultados.
Resultados Procedimiento Descriptivos de
SPSS
Dado que los resultados de la tabla no se pueden apreciar fcilmente,
vamos a emplear las propiedades interactivas de los resultados
de SPSS para modificar su forma, con el fin de aclarar su interpretacin.
Para realizarlo, debemos activarprimero la tabla haciendo doble clic sobre
ella, de modo que aparezca a su alrededor un marco de lneas
entrecortadas y a su vez, se presente la barra de herramientas de formato
[Fig.5-36]. Una vez surge la barra de herramientas, hacemos clic en el botn
Controles de pivote ( ), ubicado al costado izquierdo de barra.
Figura 5-36
Figura 5-39
Para calcular este valor, el programa exime los valores perdidos de las dos
variables, dado que en este caso los Aos estudiados es la nica variable
que cuenta con valores perdidos, el programa slo exime los cuatro valores
perdidos de esta variable. Por otro lado, si observamos las filas notaremos
que cada una de las medidas define una fila y a su vez cada medida incluye
el valor del estadstico y el valor del error tpico. Por ltimo notaremos que
este procedimiento no realiza ningn tipo de grfico de forma automtica, lo
que nos implica que si deseamos obtenerlo, es necesario realizarlo
mediante los procedimientos grficos con que cuentaSPSS.
CAPITULO 6
Tablas de Contingencia o Cruzadas con
SPSS
Las tablas de contingencia nos permiten realizar comparaciones de
Relacin / Independencia entre dos o ms variables categricas, ya sean de
tipo Nominal uOrdinal. En este tipo de tablas se definen las categoras de
una variable a travs de la frecuencia o el porcentaje de las categoras de
una segunda variable.
Para comprender el concepto nos apoyaremos en los resultados de la encuesta piloto realizada
a 20 personas cuyas preguntas son Gnero del encuestado? yTiene telfono celular?. Los
resultados de estas preguntas se plasman en lastablas de la figura [6-1]. Si nos fijamos en los
resultados de la tabla del Gnero, notaremos que el 35 % de los encuestados corresponde a
los hombres, mientras el 65 % restante corresponde a las mujeres.
Figura 6-1
Para generar una tabla de contingencia, es necesario vincular las categoras de una de las
variables en las Filas y las categoras de la segunda variable en las Columnas. Si introducimos
las categoras de la variable Gnero en las Filas y las categoras de la variable
Telfono celular en las Columnas obtendramos la tabla de la figura [6-2], en donde la posicin
uno (1) representa a los hombres que tienen telfono, la posicin dos (2) representa a los
hombres que No tienen telfono; la posicin tres (3) representa a las mujeres que tienen
telfono y la posicin cuatro (4) a las mujeres que No tienen telfono.
Para hallar la frecuencia de cada una de estas opciones, es necesario acudir a los datos y
verificar cuantos de los hombres y mujeres tienen telfono y cuantos no. Los resultados de
este procedimiento son expuestos en la figura 6-3. Adems de las frecuencias de cada uno de
los cruces de categoras, tambin se acostumbra introducir Totales en las filas y columnas, con
el fin de obtener la mayor cantidad de informacin posible de las variables.
Si nos fijamos en la tabla de la figura [6-3], notaremos que los dos totales dan
comoresultado final, el nmero de encuestados (que para el caso corresponde a 20). La nica
condicin que debe cumplir un caso (Respuestas de un encuestado) para ser incluido en
la tabla de contingencia, es tener una respuesta o valor valido en las dos o ms variables que
compongan la tabla de lo contrario, el caso ser excluido. Porejemplo, si uno de los
encuestados no responde la pregunta del Gnero, pero si la del Telfono o viceversa, el caso
ser excluido al momento de generar la tabla de contingencia.
Las tablas de contingencia pueden servir a diferentes propsitos como el anlisis descriptivo,
en cuyo caso el objetivo es proporcionar informacin condensada que describa las categoras
de las variables involucradas, sin realizar comparaciones explicitas que generen conclusiones
de una poblacin. A su vez este tipo de tablastambin pueden ser empleadas para la
generacin de anlisis de Inferencia, en donde se intenta extraer conclusiones sobre las
relaciones de las variables que puedan ser aplicadas a una poblacin.
Para este objetivo se emplean pruebas estadsticas a los datos de una muestra (por lo general
la prueba de independencia de Chi-cuadrado). Para generar unatabla de contingencia es
necesario tener un archivo de datos abierto en el Editor de datos de SPSS. Los ejemplos de
este captulo se realizarn con los datos delarchivo Cruces.sav incluido en la
carpeta Captulo6 del CD adjunto, por lo que debemos ir al men Archivo..Abrir..Datos y por
medio de la ventana de navegacin ubicar el archivo en la unidad de CD ROM.
En la seccin Casillas de seleccin, encontramos las tres ubicaciones que podemos emplear
para las variables de la tabla (Filas, Columnas o Capas); alingresar una variable a la casilla
Filas, sus categoras definen cada una de las filas de datos de la tabla; a su vez al ingresar una
variable en la casilla Columnas, sus categoras definen cada una de las columnas de la tabla.
Para comprender mejor la metodologa empleada en las tablas de contingencia y los elementos
que nos facilita el procedimiento, en las siguientes lecciones vamos a generar una serie de
ejemplos, intentando aumentar la complejidad de forma gradual.
Figura 6-8
Figura 6-9
Figura 6-10
Como de costumbre, el programa nos ofrece primero
la tabla correspondiente alresumen del procesamiento de los casos; si nos
fijamos en la combinacin Estado civil * Clase social, notaremos que se
excluy uno de los casos, debido a que cuenta con un valor perdido para la
variable Clase social. Ahora si observamos los resultados subsecuentes,
notaremos como aparecen las tablas de contingencia de cada una de las
posibles combinaciones entre las variables (Estado civil * Gneroy Estado
civil * Clase social). Cada una de estas tablas son independientes y los
resultados de las casillas no se ven afectados por la variable que no sea
relacionada.
Figura 6-11
Si nos fijamos en los resultados notaremos que cada uno de los grficos
representa la distribucin de frecuencias de una de las categoras de las
variables de capa (para el caso Clase social); en estos grficos el nmero
de casos que se incluyen depende de la frecuencia de la variable de capa,
adems es posible que algunas de las Categoras de la variable de Filas
(eje horizontal), no sean incluidas, debido a que no aparecen en los datos
de encuestados con estas caractersticas.
Figura 6-14
Figura 6-15
Figura 6-16
Note que en los porcentajes de fila para los totales de columna, los valores
son divididos por el total de casos involucrados en la encuesta (20). Al
contrario de los totales de columna, para calcular el porcentaje de fila de los
totales que representan la dimensin (Filas), se debe realizar la suma de los
valores porcentuales de las casillas de la fila. Por ejemplo, el valor del
porcentaje de fila para el total de los hombres es igual a la suma de los
porcentajes de las columnas Si y No (Casillas 1 y 2 de la tabla de la figura
6-16); es decir
Figura 6-19
Ahora, para obtener el porcentaje del Total (comnmente denominado %
de Tabla), es necesario dividir cada uno de los valores del recuento de cada
casilla por el nmero total de casos que se incluyeron en la tabla de
contingencia. Aplicado en elejemplo, equivale a tomar la frecuencia de cada
casilla y dividirla por el nmero de encuestas que para el caso corresponde
al nmero 20; los resultados de los clculos se observan en la tabla de la
figura 6-20. Dado que este tipo de porcentaje determina la proporcin de
cada casilla respecto al total de los datos (Encuestados), slo es posible
encontrar un valor del 100%, el cual equivale al total de casos.
Figura 6-20
Figura 6-21
Figura 6-22
Figura 6-23
Figura 6-24
Figura 6-25
Sin embargo, dado que los datos incluyen slo 20 casos y las casillas tienen
frecuencias esperadas menores que 5, este resultado no es fidedigno. Al
realizar una prueba exacta a la muestra obtenemos que el Chi-cuadrado
de Pearson es de 0,04, lo que conduce a la conclusin contraria. Segn la
significacin exacta, se concluir que los resultados del examen y el
material del empaque estn relacionados. Esto demuestra la importancia de
la obtencin de resultados exactos cuando no se pueden cumplir los
supuestos del mtodo asinttico. La significacin exacta es siempre fiable,
independientemente del tamao, la distribucin, la dispersin o el equilibrio
de los datos.
En conclusin, el procedimiento Tablas de contingencia nos permite
realizar tablasen las que se describan las categoras de una variable a
travs de las categoras de una segunda variable. Para efectuar la
descripcin se pueden emplear diferentes medidas como el recuento, el
porcentaje de fila, el porcentaje de columna o el porcentaje de tabla.
Adicionalmente este procedimiento nos permite generar grficos de barras
con las variables involucradas en la tabla, as como tambin pruebas
estadsticas de independencia como el Chi-cuadrado de Pearson e incluso
generar pruebas estadsticas de precisin como el mtodo de Monte Carlo o
el mtodo Exacto.
El Mdulo Base de SPSS nos permite realizar anlisis descriptivos con los
dos tipos de preguntas de respuesta mltiple y generar con ellas tablas de
frecuencia y/o de contingencia. Antes de realizar anlisis mediante SPSS,
es necesarioingresar la informacin recolectada a travs de este tipo
de preguntas en un archivo de datos. Para comprender la forma adecuada
de estructurar los resultados dentro de un archivo de datos de SPSS, vamos
a generar ejemplo apoyndonos en los resultados del sondeo realizado a
cinco personas con las preguntas
Las respuestas de cada uno de los encuestados a estas preguntas se
exponen en las tablas de las figuras [6-26] y [6-27]. Si nos fijamos en los
resultados de la primera pregunta [Fig.6-26], notaremos que cada uno de
los encuestados cuenta con un nmero distinto de respuestas y a su vez las
marcas que cada encuestado menciona son diferentes, lo que nos indica
que es esta pregunta es de tipo Abierta; la principal dificultad de
las preguntas Abiertas radica precisamente en la cantidad de
diferentes respuestas que podemos obtener. Para la
segunda pregunta [Fig.6-27], slo se incluyen las marcas que cada uno de
los encuestados confirmo que conoca; para facilitar la interpretacin,
hemos incluido dentro de la tabla nicamente las letras representativas de
cada marca, por lo que debemos recordar que la letra A equivale a la
marca Mercedes benz, la letra B a Audi, la C a Mazda y as sucesivamente.
Figura 6-26
Figura 6-27
Figura 6-28
Figura 6-29
Una vez se han ingresado todas las respuestas y se han definido todas las
propiedades a cada una de las variables, estamos listos para comenzar con
el anlisis. Antes de realizar cualquier tipo de clculo con los datos, es
necesario definirle al programa los conjuntos de variables que conforman
las respuestas de una pregunta. Para comprender el procedimiento que
conllevan las variables de repuestas mltiples vamos a emplear el contenido
del archivo de datos Multi.savque se anexa en la carpeta Captulo6 del CD
adjunto. Para abrirlo podemos emplear la ruta Archivo... Abrir... Datos, al
activarse la ventana de navegacin, ubicamos el archivo en la unidad de CD
ROM y posteriormente hacemos clic enAbrir.
Figura 6-30
Figura 6-32
Una vez se hace clic en el botn Aadir, los parmetros definidos para el
conjunto de variables desaparecen restableciendo la configuracin original
del cuadro. Para definir el segundo conjunto debemos ubicar las variables
PGMerce, PGAudi, PGMazda, PGPeug, PGBMW, PGToyota, PGNissan,
PGChevro, PGFord en la lista de variables e ingresarlas en la casilla de
seleccin; despus de ingresadas seleccionamos en la seccin Las
variables estn codificadas como la opcinDicotomas, al activarse la casilla
valor contado ingresamos el nmero uno (1) el cual corresponde al Si
(Reconoce la marca); sucesivamente en la casilla Nombreingresamos la
palabra Conoce y en la casilla de Etiqueta ingresamos la leyendaMarcas
que reconoce. Despus de definir todas las propiedades del conjunto
obtenemos los resultados de la figura [6-33]. Para finalizar hacemos clic en
Aadir de tal manera que el nombre del conjunto aparezca en la casilla de
conjuntos ($conoce).
Figura 6-33
La segunda opcin corresponde a Excluir los casos segn lista dentro de las
categoras, al seleccionarla el programa omite los casos en los que
encuentra en alguna de las variables un valor fuera del rango establecido.
Adems de las opciones de esta seccin, el programa tambin omite los
casos en los que no se encuentre un valor valido dentro de la totalidad de
las variables (Valor contado en Dicotomas o un valor del rango en
Categoras).
Sin importar que tipo de pregunta sea, las conclusiones deben ser obtenidas
deacuerdo al porcentaje de casos; por ejemplo, si asumimos que el objetivo
de las dos preguntas es identificar el reconocimiento de las marcas en el
mercado, de latabla de Dicotomas mltiples concluiramos que el 75.0% de
los encuestados reconocen la marca de automviles Mercedes Benz,
mientras que de la tabla de Categricas concluiramos que el 25.8% de los
encuestados reconoce la marca de automviles Mercedes Benz.
Figura 6-37
Figura 6-38
Figura 6-39
Figura 6-40
Si nos fijamos en los resultados de la tabla notaremos que los valores que
aparecen en la columna Total de Fila (Row total), corresponden a los
valores del recuento (Count) y porcentaje de casos (Pct of cases) obtenidos
para el conjunto de variables de dicotomas a travs
del procedimiento Frecuencias.
Si nos fijamos en los resultados de la tabla notaremos que los valores que
aparecen en la columna Total de Fila (Row total), corresponden a los
valores del recuento (Count) y porcentaje de casos (Pct of cases) obtenidos
para el conjunto de variables de dicotomas a travs
del procedimiento Frecuencias.
Figura 6-42
Figura 6-44
Figura 6-45
De igual manera ocurre si seleccionamos la categora Masculino, en cuyo
caso los valores de cada casilla cambiaran expresando el comportamiento
de la edad para los hombres. Para realizar los clculos de los estadsticos
de resumen de las variables de escala, el programa toma exclusivamente
los casos que correspondan a la categora que se haya seleccionado. Para
desactivar el Cubo basta con hacerclic fuera del rea de la tabla.
Figura 6-50
Para poder acceder al cubo es necesario hacer doble clic sobre l, con lo
que cada una de sus opciones se activar [Fig.6-51]. Si observamos las
columnas de la tablanotaremos que han desaparecido los estadsticos
(Suma y Porcentaje de suma) y en su lugar aparece la mediana. Es
necesario resaltar que los valores de los estadsticos de cada una de las
variables de escala son calculados por separado basado en las condiciones
(Categoras) de las variables de Agrupacin.
Figura 6-51
Figura 6-52
Una vez aparece el cuadro hacemos clic en el botn Diferencias con lo cual
se activa el cuadro correspondiente. Dado que existen cuatro variables
de escala en la casilla de resumen la opcin Diferencias entre variables se
encuentra disponible; al seleccionar esta opcin la seccin Diferencias entre
variables se activa, debemos observar que la ultima casilla de esta seccin
se encuentra aun deshabilitada debido a que en la Seccin tipo de
diferencia slo se encuentra seleccionada la opcin diferencia porcentual, al
activar la opcin diferencia aritmtica se activa la casilla Etiqueta
aritmtica [Fig.6-53].
Figura 6-51
Despus de activar los dos tipos de diferencias debemos definir las
variables que sern comparadas, para lo cual nos dirigimos a la
casilla variable de la seccinDiferencias entre variables y por medio del
botn desplegable ( ) ubicamos la variable Ingresos anuales (Inganual);
posteriormente, en la casilla Menos variableseleccionamos la variable
Ingresos mensuales (Ingrsos).
Figura 6-55
Figura 6-57
Figura 6-58
Figura 6-59
Es necesario recalcar que para estos valores los signos cuentan con la
misma utilidad (El signo positivo representan que el gnero femenino es
mayor que el masculino y el signo negativo representa el sentido contrario)
y a su vez los valores representan la diferencia que existe entre los dos
gneros, es decir, si por ejemploobservamos la Media de la edad del
entrevistado, este valor nos indicara que los hombres cuentan con un
promedio de edad ms alto que el de las mujeres y su diferencia es de 1.6
Aos en promedio.
Figura 6-60
CAPTULO8
Figura 8-98
Cada una de estas pruebas cuenta con la opcin Alfa (); este valor hace
referencia al nivel de confianza que deseamos que tengan los clculos de
laprueba; es decir, si queremos tener un nivel de confianza del 95%, el valor
de alfa debe ser del 0.05, lo cual corresponde al complemento porcentual de
la confianza. Continuando con el ejemplo, seleccionamos la prueba Chi-
cuadrado y mantenemos el valor del 0.05 en el Alfa; para finalizar hacemos
clic en Aceptar con lo que las tablas se generan el visor de resultados
[Fig.8-99].
Figura 8-100
Si nos fijamos en los resultados de la tabla, notaremos que el programa
realiza dos pruebas de independencia (Una para categora del Gnero). Al
igual que en elejemplo anterior, la relacin o independencia se determina de
acuerdo al valor de significacin.
Figura 8-101
Figura 8-102
Figura 8-104
Dado que la variable Estado civil cuenta con cinco categoras, el programa
genera una prueba distinta para cada una de ellas. Si nos fijamos en los
resultados de latabla para la prueba de comparacin de medias, notaremos
que la nica categora que presenta diferencias estadsticamente
significativas en la media de los gneros corresponde al Estado civil Viudo,
en las filas de esta categora aparece la letra A, lo que nos indica que el
promedio (Media) de aos estudiados para los hombres es mayor que el de
las mujeres.
Si nos fijamos en los valores del porcentaje para la categora Norte del
cruce con Divorciado, notaremos que el valor corresponde a 2.5%, mientras
que el porcentaje para la categora Sur es de 9.8%. Desde luego estas
aseguraciones no se pueden realizar hasta generar la prueba. Cabe notar
que cuando alguno de los porcentajes es cero o menor que uno, las
pruebas de comparacin no pueden realizarse.
Las pruebas de comparacin tambin pueden ser aplicadas a
variables Anidadasy /o Apiladas. Para conocer la forma en que se afecta la
prueba con la anidacin de variables, retomaremos el ejemplo anterior, pero
ingresando la variable Gnero a las filas de manera que sus categoras
aniden a la variable Estado civil.
Figura 8-106
Para definirlo, debemos ubicar en la lista las variables (Marca 1,...., Marca
7), seleccionarlas (Hacer clic sobre la primera variable (Marca 1) y
manteniendo la tecla Shif oprimida hacemos clic en la ultima variable (Marca
7)). Una vez se resaltan las variables, hacemos clic en el botn Flecha ( ),
con lo que las variables son ingresadas a la casilla de seleccin. Despus
de seleccionar las variables, activamos la opcin Categoras; note que este
cuadro nos impide especificar el rango de valores, esto se debe a que el
procedimiento las extrae de las etiquetas de valor que se hayan definido
para la primera variable del conjunto, en las propiedades de la vista de
variables del editor de datos.
Figura 8-110
En esta tabla se hace una relacin de los nombres de los conjuntos, el tipo
de respuestas, el tipo de datos y las variables que componen cada uno de
los conjuntos que se han definido. En las siguientes lecciones haremos
algunosejemplos de tablas personalizadas con conjuntos
de respuesta multiple.
Los conjuntos de respuesta mltiple pueden ser empleados para crear las
mismastablas que las variables categoras, como tablas de frecuencias, de
contingencia, anidadas, apiladas o capas. A manera de ejemplo, crearemos
algunas de estos tipos de tablas con el conjunto de dicotomas ya que es el
que contiene el menor nmero de categoras. Para nuestro primer ejemplo
crearemos una tabla de frecuencias, por lo que ubicamos en la lista de
variables el conjunto de dicotomas ($Conoce) y lo arrastramos hasta las
filas. Para finalizar hacemos clic en Aceptarcon lo que la tabla se crea en el
visor de resultados [Fig.8-112].
Figura 8-112
Cuando se trabaja con conjuntos de respuesta mltiple aparecen en el
listado de estadsticos algunas medidas exclusivas para el anlisis de
conjuntos como lasrespuestas o los porcentajes de respuestas (% de fila, %
de columna, %de subtabla y el %del total de las respuestas). Para
comprender la diferencia entre los estadsticos tradicionales y los
estadsticos de los conjuntos, retomaremos el ejemplo anterior, pero en esta
ocasin adicionaremos algunos estadsticos.
Figura 8-113