Está en la página 1de 19

Prctica 1.

Introduccin al SPSS

Prctica 1 INTRODUCCIN AL PROGRAMA SPSS Y MANEJO DE DATOS

Objetivos:
En esta prctica, se pretende familiarizar a los estudiantes con la base de datos incorporada en la aplicacin SPSS. A lo largo de la prctica los estudiantes aprendern a introducir datos desde el teclado, manejar el editor de esta aplicacin, crear nuevas variables como transformacin de las variables originales, filtrar datos y fundir e importar archivos de datos.

ndice:
1. Aspectos tcnicos 2. Entrar al programa 3. Definicin de Datos 4. Introduccin y Edicin de datos 5. Transformacin de una Variable 6. Recodificacin de una Variable 7. Filtrado de datos 8. Fundir archivos 9. Importar datos 10. Ejercicios

Prctica 1. Introduccin al SPSS

1. Aspectos tcnicos
El programa SPSS para Windows es una versin para ordenadores personales del paquete estadstico SPSS (Statistical Package for Social Sciences). El programa trabaja con 3 tipos de archivos: los archivos de datos propios de SPSS. .sav los archivos de grficos y resultados de SPSS. .spo los archivos de sintaxis de SPSS. .sps Adems, permite importar archivos creados con otras aplicaciones: Excel, Lotus, Dbase, ... y exportar archivos de datos y grficos.

2. Entrar al programa
Seleccionamos SPSS y se abrir una ventana de opciones a realizar:

Seleccionaremos Introducir datos, pulsando con el botn izquierdo del ratn en el crculo de Introducir datos y posteriormente en Aceptar y obtendremos la ventana de edicin de datos:

Prctica 1. Introduccin al SPSS

En la parte inferior de la pantalla principal aparece la barra de estado en la que hay informacin sobre el procesador de SPSS (SPSS El procesador est preparado), adems de dos pestaas que permiten seleccionar "vista de datos" o "vista de variables". En la arte superior aparece la barra de men. Al situar el puntero del ratn sobre cualquiera de sus elementos, aparece informacin sobre las operaciones que podemos realizar: Archivo: Crear, abrir o grabar los diferentes archivos de SPSS, mostrar informacin de datos...., imprimir, acceso directo a los ltimos archivos abiertos, salir del SPSS, ... Edicin: Deshacer, borrar, copiar, cortar, pegar, buscar, opciones, .. Ver: Barra de estado, Barras de herramientas, Fuentes, Cuadrcula, Etiquetas de valor. Datos: definir fechas y efectuar modificaciones en el archivo de datos: seleccionar, aadir, ponderar, ordenar, ir al caso ...., etc. Transformar: Modificacin y generacin de nuevas variables. Las funciones de este men y del anterior son temporales y slo estn vigentes durante la sesin sin que afecten al archivo original de datos. Si queremos que sean permanentes debemos grabar los cambios. Analizar: Anlisis estadsticos instalados. Grficos: Edicin y creacin de diversos tipos de grficas de alta resolucin. Utilidades: Cambiar fuentes, informacin sobre archivos. Ventana: Funciones habituales para controlar las ventanas. Se pueden distinguir los siguientes tipos de ventanas: Edicin de datos de SPSS (Ventana principal con los mens) Visor de SPSS ?: Ayuda en el formato tpico de Windows.

Prctica 1. Introduccin al SPSS

3. Definicin de los Datos


Antes de empezar el anlisis de los datos conviene, siempre, prepararlos para su mejor manejo e interpretacin. Los archivos de datos, habitualmente toman la forma de una matriz en la que cada fila representa los valores que un individuo determinado tiene para unas variables. En terminologa de SPSS cada fila es un caso. En las columnas de dicha matriz aparecen los diferentes valores que una variable determinada toma para cada uno de los individuos de ese grupo.

Veamos cmo abrir un archivo de datos: selecciona Archivo/Abrir/Datos y busca el archivo MUNDO aparecer la siguiente ventana:

Observa qu sucede al pinchar, con el ratn, el icono de etiquetas:

Prctica 1. Introduccin al SPSS

Archivo de datos MUNDO:

Este archivo contiene indicadores econmicos, demogrficos, sanitarios y de otros tipos para diversos pases del mundo. Para ello midieron las siguientes variables en 109 pases:
Pas: Pas Poblac: Poblacin x1000 Densidad: Habitantes por Km2 Urbana: Habitantes en ciudades (%) Relig: Religin mayoritaria Espvidaf: Esperanza de vida femenina Espvidam: Esperanza de vida masculina Alfabet: Alfabetizacin (%) inc_pob: Aumento de la poblacin (% anual) mortinf: Mortalidad infantil (muertes por 1000 nacimientos vivos) pib_cap Producto interior bruto per-capita regin Regin econmica caloras Ingesta diaria de caloras sida Casos de SIDA tasa_nat: Tasa de natalidad (por 1.000 habitantes) tasa_mor: Tasa de mortalidad (por 1.000 habitantes) tasasida: Casos de SIDA por 100.000 habitantes log_pib: Log(10) de PIB_CAP logtsida: Log(10) de TASASIDA nac_def: Tasa Nacimientos/Defunciones fertilid: Nmero promedio de hijos log_pob: Log(10) de POBLAC alfabmas: Hombres alfabetizados (%) alfabfem: Mujeres alfabetizadas (%) Clima: Clima predominante

El primer paso a realizar para trabajar con un archivo de datos es definir las variables. Para definir cada variable hay dos procedimientos: hacer doble clic sobre el encabezamiento de la variable o seleccionar, en la parte inferior, la pestaa Vista de variables. Veamos cmo estn definidas las variables del archivo MUNDO. Selecciona Vista de variables y aparece la ventana:

Prctica 1. Introduccin al SPSS

Observa que hay una fila para cada variable y que existen 10 columnas: Nombre, Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos, Columnas, Alineacin y Medida. La definicin de una variable se basa en las opciones que se ofrecen en esa ventana: Asignar un Nombre: a cada variable, cumpliendo las siguientes reglas: o Nombres con no ms de 8 caracteres (siendo siempre el primero una letra o @). o No utilizar smbolos como &, /, $, etc. o No utilizar nunca espacios en blanco. o No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, o
WITH.

Asignar un Tipo: a cada variable, indicando el mximo nmero de dgitos que deseamos para anotar las observaciones de la variable y el tipo de la variable con la que vamos a trabajar, alfanumrica, fecha, moneda o numrica, indicando en este caso el nmero de cifras decimales con que queremos que aparezca en el editor. o Numricas: formato numrico estndar o Coma: comas de separacin cada tres posiciones. Un punto para la parte o decimal. o Punto: al contrario que el anterior. o Notacin Cientfica: uso de la E para exponente. Ejemplo 2,34E2 o Cadena: variable alfanumrica. (de ms de 8 caracteres se considera larga). o Adems estn los formatos de fecha, dlar y moneda personalizada.

Si no las escogemos, el sistema las asigna automticamente, siendo el formato por defecto: Numrica 8.2 que significa: Anchura: 8 y Decimales: 2, es decir, una amplitud de columna de 8 espacios, siendo los 2 ltimos para los decimales. Haz un clic sobre el recuadro coloreado en la celda correspondiente al Tipo en la variable densidad y observa estas posibilidades.

Pulsa los tipos Fecha, Dlar, Moneda personalizada y Cadena y observa los formatos permitidos. Para salir, sin modificar el tipo original de la variable, pulsa Cancelar. Observa el tipo del resto de variables.

Prctica 1. Introduccin al SPSS

Asignar una Etiqueta: a cada variable de no ms de 120 caracteres (entre 30 y 40 es el valor recomendado) que nos permita tener ms informacin sobre esa variable. Asignar Valores: se trata de asignar etiquetas a los valores de cada variable. No es obligatorio, pero s muy til en algunos casos. Sitate en el campo correspondiente a Valores de la variable clima y pincha sobre el recuadro coloreado: Qu significa esta variable? Qu valores toma? Qu significa cada valor? Para salir, pulsa Cancelar.

Definir Perdidos: permite definir los valores de los datos especificados como perdidos por el usuario. A menudo es til para saber por qu se pierde informacin. Por ejemplo, puedes querer distinguir el dato perdido correspondiente a un entrevistado que se niega a responder, del dato perdido debido a que la pregunta no afectaba a dicho entrevistado. Los valores de datos especificados como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayora de los clculos.

Sitate en el campo correspondiente a Perdidos de cualquier variable y pincha sobre el recuadro coloreado, aparece:

Los cdigos asignados a los valores ausentes deben de ser coherentes con el tipo de variables declarado: Numricos para las numricas y alfanumricos para las alfanumricas (mximo 9 caracteres). Se pueden introducir hasta 3 valores perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango ms un valor de tipo discreto. Slo pueden especificarse rangos para las variables numricas.

Prctica 1. Introduccin al SPSS

Estos valores ausentes son denominados por SPSS "valores ausentes definidos por el usuario" (user-defined missing values), a diferencia de los definidos por el sistema (systemmissing values o sysmis). Estos ltimos corresponden a los que establece el sistema para los espacios en blanco y caracteres ilegales que puedan haber en el archivo de datos. Aparecen en los listados representados por comas. Definir Columnas: consiste en especificar la amplitud de la columna. Podemos hacerlo tambin desde el propio archivo de datos. Definir Alineacin: seleccionar la justificacin de las entradas de la columna: Izquierda, Derecha y Centrado. Especificar medida. Se puede seleccionar uno de los tres niveles de medida: o Escala: los valores de datos son numricos en una escala de intervalo. Las variables de escala deben ser numricas. o Ordinal: los valores de datos representan categoras con un cierto orden intrnseco (bajo, medio, alto; totalmente de acuerdo, de acuerdo, en desacuerdo). Las variables ordinales pueden ser de cadena o valores numricos. Notar que para variables de cadena ordinales, se asume que el orden alfabtico de los valores de cadena indica el orden correcto de las categoras; en el caso de bajo, medio y alto el orden sera alto, bajo y medio (orden que no es correcto), por lo que es ms fiable utilizar cdigos numricos para representar datos ordinales que usar etiquetas de estos cdigos. o Nominal: los valores de datos representan categoras sin un cierto orden intrnseco. Las variables nominales pueden ser de cadena o valores numricos que representan categoras diferentes, por ejemplo 1 = Hombre y 2 = Mujer. Observa cmo han sido definidas todas las variables del archivo MUNDO Para salir de cada ventana, pulsa Cancelar, as evitars modificar el archivo.

Prctica 1. Introduccin al SPSS

4. Introduccin y Edicin de los datos


Para abrir un archivo nuevo de datos de SPSS debemos seleccionar el men de Archivo/Nuevo/Datos: Si ya estamos en el editor de datos vaco, no hace falta.

Si, previamente, tenamos abierto otro archivo de datos, por ejemplo


MUNDO.sav, y hemos realizado alguna modificacin de este archivo, antes de cerrar ste y abrir uno nuevo, nos preguntar si queremos guardar los cambios realizados. La respuesta es NO, de este modo, el archivo original no ser modificado.

Una vez tengas la ventana del Editor de datos del SPSS abierta y vaca, lee atentamente las siguientes instrucciones antes de introducir datos: Debemos definir las variables adecuadamente (en Vista de variables) de forma que despus podamos empezar a introducir los datos en cualquier orden (en Vista de datos). Para introducir los datos, nos situamos en una casilla, tecleamos su valor y pulsamos Intro o el Tabulador o nos situamos con el ratn en otra casilla. Podemos introducir los datos por filas o columnas indistintamente. Conviene ir actualizando el archivo con la opcin Guardar Datos o con el botn de grabar habitual en otras aplicaciones Windows. Para ello: o si ya lo habamos guardado con anterioridad, para guardar las ltimas modificaciones, seleccionaremos la opcin de Guardar dentro de Archivo, o si es la primera vez que lo guardamos, como todava no le hemos asignado un nombre al archivo, seleccionaremos la opcin Guardar como ... dentro de Archivo. Nos pedir el nombre que queremos darle al archivo, su extensin (por defecto utilizar .sav para datos del SPSS) y la carpeta en que queremos guardarlo. Ejercicio1: Introduce el archivo de datos que aparece a continuacin siguiendo las instrucciones. Ten en cuenta que las variables ozono y provin son numricas y se les han de asignar valores tal como se ha explicado en la pgina 6. Este archivo de datos recoge la informacin obtenida en un proyecto de investigacin medioambiental en el que se estudiaron los niveles de contaminacin atmosfrica en la Comunidad Valenciana. Para ello analizaron 5 observaciones aleatorias en cada provincia, midiendo en el aire la concentracin de sulfato, el pH y la presencia de un nivel elevado de ozono. Los datos obtenidos se encuentran en las variables: sulfato: concentracin de sulfato en el aire. pH: pH observado en el aire. provin: provincia en la que se recogi la informacin. ozono: indica si hay un nivel elevado de ozono. 1.- Define las variables con el nombre indicado, el tipo y formato convenientes. 2.- Introduce los valores numricos del archivo de datos. 3.- Graba el archivo de datos con nombre ambiente.sav

Prctica 1. Introduccin al SPSS

10

Una vez introducidos los datos podemos considerar el modificarlos, ya sea para introducir o ampliar con nuevos valores o para rectificar alguno ya introducido. La edicin de datos en SPSS contiene comandos para: cortar, copiar, pegar, eliminar y buscar (similar a otras aplicaciones Windows), insertar variables o casos, ir al caso, ordenar casos,... y se encuentran en el men Edicin y Datos. Ejercicio 2. 1 - Insertar, entre los individuos 4 y 5, los datos correspondientes al siguiente individuo: 2,9473 6,9708 Alto licante Para ello, nos situamos en el individuo n 5 y seleccionamos Insertar caso. 2 - Modificar el valor de la variable sulfato del individuo 11, por 2,2 3 - Modificar las especificaciones (nombre, tipo y formato columna ) de las variables para que tengan presentacin que t desees. 4.- Asignar las siguientes etiquetas de variable: ozono nivel de ozono registrado provin provincia del lugar de recogida de datos 5.- Sitate en Vista de datos y coloca la flecha del ratn encima del nombre de cualquier variable, qu observas? 6.- Asignar etiquetas de valor a las variables ozono y provin: ozono: 0 = normal, 1 = alto provin: 1 = Alicante, 2 = Castelln, 3 = Valencia 7.- Pulsa el smbolo de etiqueta de la barra de herramientas, qu observas? 8.- Guardar las modificaciones en el archivo ambiente.sav

Prctica 1. Introduccin al SPSS

11

5. Transformacin de una Variable


Una vez elaborado el archivo de datos, y previamente al anlisis estadstico de los datos es posible modificar los datos originales presentes en el archivo. Tales cambios pueden referirse a las variables, a los casos, o al archivo en su conjunto. Puede interesarnos tanto la recodificacin de los valores de una variable como la generacin de nuevas mediante transformaciones de las ya existentes. SPSS permite generar nuevas variables mediante transformaciones numricas efectuadas sobre las antiguas. Supongamos que, despus de tener el archivo de datos ya introducido, hemos detectado un error en la medicin del pH debido a que el aparato utilizado incrementa en 0,3 unidades todas las mediciones que realiza. Convendra generar una nueva variable que incorporara esta correccin. Para ello elegimos Transformar/ Calcular, y realizamos los siguientes pasos: 1. asignar un nombre y un tipo (por defecto ser numrica) a la nueva variable en el cuadro de texto de la Variable de destino, en nuestro caso new_pH 2. definir la Expresin numrica que va a permitir calcular los valores de la misma. Para ello utilizaremos los nombres de las variables del archivo (podemos escribirlos o seleccionarlos del listado que aparece), constantes, operadores y funciones.

3.

pulsa Aceptar.

Para construir estas expresiones pueden usarse operadores aritmticos como +, -, *, /, ** y funciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN, ABS, MOD10, TRUNC, RND, entre otras muchas:

MOD10

Resto resultante de dividir entre 10.

Prctica 1. Introduccin al SPSS

12

TRUNC RND

Parte entera de un nmero. Redondeo al entero ms cercano.

Pulsando el botn derecho sobre le nombre de la funcin, aparece su descripcin. El argumento de las funciones debe ir entre parntesis. Existen funciones particulares como UNIFORM y NORMAL, que se utilizan para la generacin de variables aleatorias. Son de bastante utilidad en estudios de simulacin. Es importante tener cuidado con el orden de utilizacin de los operadores y no olvidar que los valores antiguos pierden su vigencia al recodificar una variable sobre el mismo nombre. El botn SI permite realizar modificaciones similares, pero sujetas a que se verifique una condicin lgica. Se incluirn aquellos casos que verifiquen la condicin. Los que no la cumplan pasarn a ser valores ausentes definidos por el sistema. Por ejemplo, si queremos modificar slo las observaciones realizadas en Alicante, en una nueva variable new2_pH, deberemos:

pulsar en el recuadro Si ... seleccionar Incluir si el caso satisface la condicin escribir la condicin: provin = 1

pulsar Continuar y en la siguiente pantalla pulsar Aceptar.

Una expresin lgica es una expresin que puede ser evaluada como verdadera o falsa en funcin de los valores de las variables en ella relacionadas. El nexo de las variables son los operadores de relacin: = , >= , <= , < , > , ~= . Es posible formar expresiones complejas, utilizando los operadores lgicos: AND (&), OR ( | ), NOT (~).

6. Recodificacin de una Variable

Prctica 1. Introduccin al SPSS

13

A partir de una variable podemos crear otra cuyos valores sean una recodificacin de los de la primera. Esta recodificacin podemos hacerla tanto en la misma variable como en variables diferentes. Para ello, seleccionaremos Transformar/Recodificar/En distintas variables... Se abre una ventana en la que deberemos asignar un nombre ( y una etiqueta si queremos) a la nueva variable.

Cuidado!, si seleccionas En las mismas variables ... borrars la variable original.


Vamos a ver cmo recodificar la variable sulfato en una nueva variable llamada niv_sulf, clasificndolo en: bajo [0,3), medio [3,6), alto [6,9) y muy alto [9,11].

1.

Seleccionamos la variable sulfato, escribimos el nombre de la Variable de resultado, y pulsamos Cambiar:

2. Pulsamos en Valores antiguos y nuevos ..... Aqu especificaremos los valores antiguos y sus nuevos valores. Es muy til cuando queremos recodificar variables cuantitativas mediante el establecimiento de intervalos. Para ello utilizamos las posibilidades descritas en Rango: Para especificar 0 sulfato < 3 niv_sulf = 1, escribiremos en rango (valores antiguos) 0 y 3, y en valor nuevo, 1, pulsaremos aadir y realizaremos los mismos pasos con el resto de intervalos. A continuacin, pulsar Continuar y en la siguiente pantalla Aceptar. Observa el contenido de la nueva variable. Observas algo anmalo?

Ejercicio 4. 1. Aadir, a la variable niv_sulf las etiquetas de valores para leer baja, media, alta y muy alta. 2. Recodificar la variable provin en una nueva variable cod_prov que contenga los prefijos telefnicos de la provincia: Alicante 965, Castelln 964 y Valencia 963.

Prctica 1. Introduccin al SPSS

14

7. Filtrado de datos

Prctica 1. Introduccin al SPSS

15

El programa SPSS permite seleccionar determinados casos para un prximo proceso, bien temporalmente o de forma permanente, sobre la base de un criterio lgico o de una decisin aleatoria. Para ello seleccionaremos el men Datos/Seleccionar casos...

La seleccin de individuos puede ser temporal (filtrados) o permanente (eliminados): En la seleccin permanente eliminamos del archivo activo los individuos deseados, mientras que en la temporal, la seleccin es recuperable (los casos son filtrados). En esta ltima situacin, los individuos (casos) del archivo que no satisfacen la condicin aparecern marcados como excluidos mediante una lnea que cruza en diagonal su nmero de fila. Aparece tambin una variable llamada FILTER_$ que el sistema crea para controlar el filtrado de datos. Veamos cmo seleccionar, sin eliminar, las filas correspondientes a las mediciones con bajo nivel de sulfato: seleccionamos Si se satisface la condicin seleccionamos Filtrados pinchamos en el cuadro Si. Especificamos la condicin niv_sulf = 1 pulsamos Continuar y, despus, Aceptar. Observa el resultado y despus selecciona Todos los casos o Restablecer para volver a considerar todos los individuos del archivo de datos.

Especificaciones: Todos los casos: indica que quiere procesar todos los casos del archivo de datos de trabajo. Si se satisface la condicin: indica que quiere procesar slo los casos que satisfagan una condicin lgica. Para especificar o cambiar la condicin, pulse en Si. Esta alternativa crea la variable filter_$, que el sistema crea para controlar el filtrado de datos. Muestra aleatoria de casos: indica que queremos seleccionar los casos de forma aleatoria para su procesamiento. Si ha tecleado las especificaciones de muestreo, stas

Prctica 1. Introduccin al SPSS

16

aparecern junto al botn de comando Muestra. Si no, o si quiere cambiarlas, pulse en Muestra (vase ms adelante). Esta alternativa tambin crea la variable filter_$. Basndose en el rango del tiempo o de los casos: permite seleccionar los casos deseados siempre que sean consecutivos, por ejemplo del 3 al 27. Usar variable de filtro: indica que quiere utilizar los valores de una variable numrica existente para controlar el filtrado de casos. Seleccione la variable de la lista de la izquierda. Los casos cuyo valor sea 0, o ausentes, en la variable de filtro se excluyen del anlisis. Ejercicio 5 Seleccionar, para trabajar durante una sesin, los valores de pH por debajo de 6,0. Desactivar el filtrado anterior Seleccionar los 8 primeros datos de todas las variables ($casenum < 9). Desactivar el filtrado anterior

Prctica 1. Introduccin al SPSS

17

8. Fundir archivos
SPSS permite aadir casos desde un archivo.sav a otro y tambin variables de un archivo a otro: Aadir casos: En primer lugar, crea y salva los dos archivos siguientes: Archivo: fundir1a.sav

Archivo: fundir1b.sav

Vamos a copiar los casos del archivo fundir1b.sav a continuacin de los casos del archivo fundir1a.sav. Para ello seguiremos los pasos siguientes: 1. abre el archivo fundir1a.sav, 2. selecciona del men: Datos/ Fundir Archivos/Aadir casos 3. selecciona el archivo fundir1b.sav, 4. SPSS mostrar las variables coincidentes que aparecern en el nuevo archivo, 5. despus de Aceptar, la fusin se realiza. 6. el archivo resultante se guarda con el nombre que se desee. Si hubiera variables que no coincidiesen en nombre en ambos archivos, SPSS permite emparejarlas. Aadir variables: Al archivo resultante de la fusin anterior vamos a aadirle variables nuevas que se encuentran en otro archivo. Para ello es necesario que ambos archivos compartan una variable que identifique los casos, en nuestro caso usaremos la variable clave. En primer lugar crea y salva el siguiente archivo: fundir1c.sav

Notar

que

aparecen

Prctica 1. Introduccin al SPSS

18

los mismos casos etiquetados por la variable clave, en distinto orden. Los pasos a seguir son los siguientes: 1. ordenar ascendentemente el archivo fundir1c.sav por la variable clave y guardarlo, 2. ordenar ascendentemente el archivo fundir1a.sav por la variable clave y guardarlo, 3. seleccionar el men Datos/Fundir Archivos/Aadir variables. Obtendremos el siguiente cuadro de dilogo:

donde se ha seleccionado la opcin marcada y como variable clave se ha elegido clave. 4. despus de Aceptar, se obtiene el archivo fusionado que podr guardarse con el nombre que se desee.

Prctica 1. Introduccin al SPSS

19

9. Importar datos
Vamos a importar un archivo de texto y convertirlo al formato SPSS. Con el bloc de notas de Windows (Inicio/Programas/Accesorios) crear y salvar el archivo siguiente:

Se observa que: cada registro tiene 4 campos de tipos diferentes, separados por un espacio en blanco, los campos no estn encolumnados, esto se conoce como formato libre Para importar este archivo seleccionaremos el men Archivo/ Leer datos de texto, introducir el nombre del archivo y seguir los pasos que se indican.

También podría gustarte