Está en la página 1de 11

Escuela Nacional de Estadstica e Informtica

NOMBRE DEL CURSO

Lima Per 2013

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

Prctica Sesin 2 INTRODUCCIN AL PROGRAMA SPSS Y MANEJO DE DATOS

Objetivos:
En esta prctica, se pretende familiarizar a los estudiantes con la base de datos incorporada en la aplicacin SPSS. A lo largo de la prctica los estudiantes aprendern a introducir datos desde el teclado, manejar el editor de esta aplicacin, crear nuevas variables como transformacin de las variables originales, filtrar datos y fundir e importar archivos de datos.

ndice:
1. Aspectos tcnicos 2. Entrar al programa 3. Definicin de Datos 4. Introduccin y Edicin de datos

Numero de Pagina: 2

Total de Paginas:11

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

1. Aspectos tcnicos
El programa SPSS para Windows es una versin para ordenadores personales del paquete estadstico SPSS (Statistical Package for Social Sciences). El programa trabaja con 3 tipos de archivos: los archivos de datos propios de SPSS. .sav los archivos de grficos y resultados de SPSS. .spo los archivos de sintaxis de SPSS. .sps Adems, permite importar archivos creados con otras aplicaciones: Excel, Lotus, Dbase, ... y exportar archivos de datos y grficos.

2. Entrar al programa
Seleccionamos SPSS y se abrir una ventana de opciones a realizar:

Seleccionaremos Introducir datos, pulsando con el botn izquierdo del ratn en el crculo de Introducir datos y posteriormente en Aceptar y obtendremos la ventana de edicin de datos:

Numero de Pagina: 3

Total de Paginas:11

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

En la parte inferior de la pantalla principal aparece la barra de estado en la que hay informacin sobre el procesador de SPSS (SPSS El procesador est preparado), adems de dos pestaas que permiten seleccionar "vista de datos" o "vista de variables". En la arte superior aparece la barra de men. Al situar el puntero del ratn sobre cualquiera de sus elementos, aparece informacin sobre las operaciones que podemos realizar: Archivo: Crear, abrir o grabar los diferentes archivos de SPSS, mostrar informacin de datos...., imprimir, acceso directo a los ltimos archivos abiertos, salir del SPSS, ... Edicin: Deshacer, borrar, copiar, cortar, pegar, buscar, opciones, .. Ver: Barra de estado, Barras de herramientas, Fuentes, Cuadrcula, Etiquetas de valor. Datos: definir fechas y efectuar modificaciones en el archivo de datos: seleccionar, aadir, ponderar, ordenar, ir al caso ...., etc. Transformar: Modificacin y generacin de nuevas variables. Las funciones de este men y del anterior son temporales y slo estn vigentes durante la sesin sin que afecten al archivo original de datos. Si queremos que sean permanentes debemos grabar los cambios. Analizar: Anlisis estadsticos instalados. Grficos: Edicin y creacin de diversos tipos de grficas de alta resolucin. Utilidades: Cambiar fuentes, informacin sobre archivos. Ventana: Funciones habituales para controlar las distinguir los siguientes tipos de ventanas: ventanas. Se pueden

o Edicin de datos de SPSS (Ventana principal con los mens) o Visor de SPSS
Numero de Pagina: 4 Total de Paginas:11

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

o ?: Ayuda en el formato tpico de Windows.

3. Definicin de los Datos


Antes de empezar el anlisis de los datos conviene, siempre, prepararlos para su mejor manejo e interpretacin. Los archivos de datos, habitualmente toman la forma de una matriz en la que cada fila representa los valores que un individuo determinado tiene para unas variables. En terminologa de SPSS cada fila es un caso. En las columnas de dicha matriz aparecen los diferentes valores que una variable determinada toma para cada uno de los individuos de ese grupo.

Veamos cmo abrir un archivo de datos: selecciona Archivo/Abrir/Datos y busca el archivo MUNDO aparecer la siguiente ventana:

Observa qu sucede al pinchar, con el ratn, el icono de etiquetas:

Numero de Pagina: 5

Total de Paginas:11

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

Archivo de datos MUNDO:

Este archivo contiene indicadores econmicos, demogrficos, sanitarios y de otros tipos para diversos pases del mundo. Para ello midieron las siguientes variables en 109 pases:
Pas: Pas Poblac: Poblacin x1000 Densidad: Habitantes por Km2 Urbana: Habitantes en ciudades (%) Relig: Religin mayoritaria Espvidaf: Esperanza de vida femenina Espvidam: Esperanza de vida masculina Alfabet: Alfabetizacin (%) inc_pob: Aumento de la poblacin (% anual) mortinf: Mortalidad infantil (muertes por 1000 nacimientos vivos) pib_cap Producto interior bruto per-capita regin Regin econmica caloras Ingesta diaria de caloras sida Casos de SIDA tasa_nat: Tasa de natalidad (por 1.000 habitantes) tasa_mor: Tasa de mortalidad (por 1.000 habitantes) tasasida: Casos de SIDA por 100.000 habitantes log_pib: Log(10) de PIB_CAP logtsida: Log(10) de TASASIDA nac_def: Tasa Nacimientos/Defunciones fertilid: Nmero promedio de hijos log_pob: Log(10) de POBLAC alfabmas: Hombres alfabetizados (%) alfabfem: Mujeres alfabetizadas (%) Clima: Clima predominante

El primer paso a realizar para trabajar con un archivo de datos es definir las variables. Para definir cada variable hay dos procedimientos: hacer doble clic sobre el encabezamiento de la variable o seleccionar, en la parte inferior, la pestaa Vista de variables. Veamos cmo estn definidas las variables del archivo MUNDO. Selecciona Vista de variables y aparece la ventana:

Numero de Pagina: 6

Total de Paginas:11

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

Observa que hay una fila para cada variable y que existen 10 columnas: Nombre, Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos, Columnas, Alineacin y Medida. La definicin de una variable se basa en las opciones que se ofrecen en esa ventana: o Asignar un Nombre: a cada variable, cumpliendo las siguientes reglas: Nombres con no ms de 8 caracteres (siendo siempre el primero una letra o @). o No utilizar smbolos como &, /, $, etc. o No utilizar nunca espacios en blanco. o No utilizar expresiones como ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, o
WITH.

Asignar un Tipo: a cada variable, indicando el mximo nmero de dgitos que deseamos para anotar las observaciones de la variable y el tipo de la variable con la que vamos a trabajar, alfanumrica, fecha, moneda o numrica, indicando en este caso el nmero de cifras decimales con que queremos que aparezca en el editor. o Numricas: formato numrico estndar o Coma: comas de separacin cada tres posiciones. Un punto para la parte o decimal. o Punto: al contrario que el anterior. o Notacin Cientfica: uso de la E para exponente. Ejemplo 2,34E2 o Cadena: variable alfanumrica. (de ms de 8 caracteres se considera larga). o Adems estn los formatos de fecha, dlar y moneda personalizada. Si no las escogemos, el sistema las asigna automticamente, siendo el formato por defecto: Numrica 8.2 que significa: Anchura: 8 y Decimales: 2, es decir, una amplitud de columna de 8 espacios, siendo los 2 ltimos para los decimales. Haz un clic sobre el recuadro coloreado en la celda correspondiente al Tipo en la variable densidad y observa estas posibilidades.

Pulsa los tipos Fecha, Dlar, Moneda personalizada y Cadena y observa los formatos permitidos. Para salir, sin modificar el tipo original de la variable, pulsa Cancelar. Observa el tipo del resto de variables.

Numero de Pagina: 7

Total de Paginas:11

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

Asignar una Etiqueta: a cada variable de no ms de 120 caracteres (entre 30 y 40 es el valor recomendado) que nos permita tener ms informacin sobre esa variable.

Asignar Valores: se trata de asignar etiquetas a los valores de cada variable. No es obligatorio, pero s muy til en algunos casos. Sitate en el campo correspondiente a Valores de la variable clima y pincha sobre el recuadro coloreado: Qu significa esta variable? Qu valores toma? Qu significa cada valor? Para salir, pulsa Cancelar.

Definir Perdidos: permite definir los valores de los datos especificados como perdidos por el usuario. A menudo es til para saber por qu se pierde informacin. Por ejemplo, puedes querer distinguir el dato perdido correspondiente a un entrevistado que se niega a responder, del dato perdido debido a que la pregunta no afectaba a dicho entrevistado. Los valores de datos especificados como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayora de los clculos. Sitate en el campo correspondiente a Perdidos de cualquier variable y pincha sobre el recuadro coloreado, aparece:

Los cdigos asignados a los valores ausentes deben de ser coherentes con el tipo de variables declarado: Numricos para las numricas y alfanumricos para las alfanumricas (mximo 9 caracteres). Se pueden introducir hasta 3 valores perdidos (individuales) de tipo discreto, un rango de valores perdidos o un rango ms un valor de tipo discreto. Slo
Numero de Pagina: 8 Total de Paginas:11

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

pueden especificarse rangos para las variables numricas. Estos valores ausentes son denominados por SPSS "valores ausentes definidos por el usuario" (user-defined missing values), a diferencia de los definidos por el sistema (system- missing values o sysmis). Estos ltimos corresponden a los que establece el sistema para los espacios en blanco y caracteres ilegales que puedan haber en el archivo de datos. Aparecen en los listados representados por comas. Definir Columnas: consiste en especificar la amplitud de la columna. Podemos hacerlo tambin desde el propio archivo de datos. Definir Alineacin: seleccionar la justificacin de las entradas de la columna: Izquierda, Derecha y Centrado. Especificar medida. Se puede seleccionar uno de los tres niveles de medida: Escala: los valores de datos son numricos en una escala de intervalo. Las variables de escala deben ser numricas. Ordinal: los valores de datos representan categoras con un cierto orden intrnseco (bajo, medio, alto; totalmente de acuerdo, de acuerdo, en desacuerdo). Las variables ordinales pueden ser de cadena o valores numricos. Notar que para variables de cadena ordinales, se asume que el orden alfabtico de los valores de cadena indica el orden correcto de las categoras; en el caso de bajo, medio y alto el orden sera alto, bajo y medio (orden que no es correcto), por lo que es ms fiable utilizar cdigos numricos para representar datos ordinales que usar etiquetas de estos cdigos. Nominal: los valores de datos representan categoras sin un cierto orden intrnseco. Las variables nominales pueden ser de cadena o valores numricos que representan categoras diferentes, por ejemplo 1 = Hombre y o 2 = Mujer. Observa cmo han sido definidas todas las variables del archivo MUNDO Para salir de cada ventana, pulsa Cancelar, as evitars modificar el archivo.

4. Introduccin y Edicin de los datos


Para abrir un archivo nuevo de datos de Archivo/Nuevo/Datos: SPSS debemos seleccionar el men de

Si ya estamos en el editor de datos vaco, no hace falta.

Si, previamente, tenamos abierto otro archivo de datos, por ejemplo


MUNDO.sav, y hemos realizado alguna modificacin de este archivo, antes de cerrar ste y abrir uno nuevo, nos preguntar si queremos guardar los cambios realizados. La respuesta es NO, de este modo, el archivo original no ser modificado. Una vez tengas la ventana del Editor de datos del SPSS abierta y vaca, lee atentamente las siguientes instrucciones antes de introducir datos: Debemos definir las variables adecuadamente (en Vista de variables) de forma que despus podamos empezar a introducir los datos en cualquier orden (en Vista de datos).

Numero de Pagina: 9

Total de Paginas:11

Instituto Nacional de Estadstica e Informtica SPSS BSICO

Escuela Nacional de Estadstica e Informtica

Para introducir los datos, nos situamos en una casilla, tecleamos su valor y pulsamos Intro o el Tabulador o nos situamos con el ratn en otra casilla. Podemos introducir los datos por filas o columnas indistintamente. Conviene ir actualizando el archivo con la opcin Guardar Datos o con el botn de grabar habitual en otras aplicaciones Windows. Para ello:

Ejercicio1: Introduce el archivo de datos que aparece a continuacin siguiendo las instrucciones. Ten en cuenta que las variables ozono y provin son numricas y se les han de asignar valores tal como se ha explicado en la pgina 6. Este archivo de datos recoge la informacin obtenida en un proyecto de investigacin medioambiental en el que se estudiaron los niveles de contaminacin atmosfrica en la Comunidad Valenciana. Para ello analizaron 5 observaciones aleatorias en cada provincia, midiendo en el aire la concentracin de sulfato, el pH y la presencia de un nivel elevado de ozono. Los datos obtenidos se encuentran en las variables: sulfato: concentracin de sulfato en el aire. pH: pH observado en el aire. provin: provincia en la que se recogi la informacin. ozono: indica si hay un nivel elevado de ozono. 1.- Define las variables con el nombre indicado, el tipo y formato convenientes. 2.- Introduce los valores numricos del archivo de datos. 3.- Graba el archivo de datos con nombre ambiente.sav

Numero de Pagina: 10

Total de Paginas:11

Una vez introducidos los datos podemos considerar el modificarlos, ya sea para introducir o ampliar con nuevos valores o para rectificar alguno ya introducido. La edicin de datos en SPSS contiene comandos para: cortar, copiar, pegar, eliminar y buscar (similar a otras aplicaciones Windows), insertar variables o casos, ir al caso, ordenar casos,... y se encuentran en el men Edicin y Datos. Ejercicio 2. 1. Insertar, entre los individuos 4 y 5, los datos correspondientes al siguiente individuo: 2,9473 6,9708 Alto Alicante 2. Para ello, nos situamos en el individuo n 5 y seleccionamos Insertar caso. 3. Modificar el valor de la variable sulfato del individuo 11, por 2,2 4. Modificar las especificaciones (nombre, tipo y formato columna) de las variables para que tengan presentacin que t desees. 5. Asignar las siguientes etiquetas de variable: Ozono nivel de ozono registrado Provin provincia del lugar de recogida de datos 6. Sitate en Vista de datos y coloca la flecha del ratn encima del nombre de cualquier variable, qu observas? 7. Asignar etiquetas de valor a las variables ozono y provin: ozono: 0 = normal, 1 = alto provin: 1 = Alicante, 2 = Castelln, 3 = Valencia 8. Pulsa el smbolo de etiqueta de la barra de herramientas, qu observas? 9. Guardar las modificaciones en el archivo ambiente.sav

También podría gustarte