Está en la página 1de 9

Instrucciones para el uso del programa SPSS

SPSS. Instrucciones para introducir los datos.


Sera interesante que cada alumno/a se traiga un disquete para guardar en l su trabajo
Para aprender a introducir los datos, crearemos un pequeo fichero con los datos obtenidos a
partir de las respuestas a una encuesta en la que al menos hay 4 preguntas. Edad, Sexo,
Estudios y Salario. Tu puedes poner ms.
Introduciremos al menos 5 variables, la primera nos servir de control y ser ncuest (nmero
de cuestionario) y las siguientes sern las preguntas de la encuesta: Edad, Sexo, Estudios y
Salario.etc.
Primero definiremos estas variables y despus introduciremos las respuestas de unas cuantas
encuestas ficticias o reales.
Haciendo doble clic en el icono del SPSS entraremos en el programa y si nos ofrece varias
opciones elegiremos la opcin INTRODUCIR DATOS y luego aceptar. Tambin es posible que
directamente aparezcan las filas y columnas de una especie de hoja de clculo donde
introduciremos los datos. En la parte inferior hay dos pestaas: vista de variables y vista de
datos. Elegiremos vista de variables y nos situaremos en el rectngulo de la primera fila que
est bajo NOMBRE e introduciremos en l el nombre de la primera variable ncuest .
Luego siguiendo en la misma fila, bajo TIPO elegiremos el tipo de esta variable. Para ver los
tipos posibles se pulsa en el cuadradito con puntos suspensivos. Para esta variable podemos
elegir numrica con anchura 3 y con ningn decimal y pulsamos el botn aceptar. Debajo de
etiqueta pondremos Nmero de cuestionario, las otra casillas se pueden quedar en blanco.
En la fila segunda bajo NOMBRE pondremos el nombre de la segunda variable Edad , tipo
numrico, anchura 3, decimales ninguno, en valores dejamos ninguno y en perdidos
pondremos 999 (para los que no contesten a esta pregunta), en medida pondremos escala
En la siguiente fila escribiremos el nombre de la siguiente variable, Sexo, en tipo pondremos
cadena, en anchura pondremos 1 en etiqueta pondremos sexo del/a encuestado/a en
valores el valor 1 le etiquetamos como mujer y se pulsa aadir y al valor 2 le etiquetamos como
hombre, pulsar aadir y luego aceptar. Bajo perdidos pondremos 0 (para los que no respondan
a esta pregunta). En medida poner nominal,
En la fila siguiente pondremos Estudios y en tipo cadena en etiqueta pondremos estudios
finalizados, bajo valores pondremos las siguientes etiquetas 0 para sin estudios , 1 para
ESO, 2 para Mdulos FP grado medio, 3 para Bachillerato, 4 para Mdulos FP grado superior y
5 para Estudios Universitarios. En perdidos pondremos 9 para los que dejen sin contestar esta
pregunta, en medida le pondremos ordinal
En la siguiente fila pondremos Salario , tipo numrico, anchura 8, decimales 2, perdidos
9999, en medida escala.
Antes de continuar, se guarda este trabajo, por si surgen problemas, que no lo perdamos. Se
hace en la forma habitual de guardar un fichero en WINDOWS
1

En el MENU superior a la derecha pulsamos en Archivo, se despliega un men y pulsamos en


GUARDAR COMO. Lo guardaremos en el disquete A, con el nombre que queramos, se sugiere,
trabajo1.
Si miramos debajo de la pantalla y nos cambiamos de la solapa vista de variables a vista de
datos, aparecer una tabla en la que las variables que acabamos de definir aparecen en la
primera fila. Lo nico que hay que hacer ahora es rellenar los datos en sus casillas
correspondientes. Recordar que en sexo pondremos 1 a las mujeres, y 2 a los hombres, y 0 a
los que no contesten. En Estudios usar los cdigos (0,1,2,3,4 y 5) que se introdujeron
previamente. Cuando todo est completo guardarlo al disco como se hizo anteriormente.
Para empezar a ver resultados: elegir Analizar (men superior) elegir Estadsticos descriptivos,
frecuencias. Sealar las variables que nos interesa estudiar y pasarlas al rectngulo de la
derecha.
Trabajo con un fichero de datos ya creado.
Copiar en el disquete A:, el fichero de datos (ejemplo1) que est en la carpeta Benita (dentro de
la carpeta prcticas).
Entrar en SPSS de la forma habitual y estando en el editor de datos, elegir en el men
superior : ARCHIVO -> ABRIR -> DATOS
Y abrir el fichero de datos que acabamos de copiar en nuestro disquete, A:ejemplo1
Pulsando en la pestaa inferior VISTA DE VARIABLES podemos ver las 18 variables que estn
definidas en este fichero de datos y si pulsamos en la pestaa VISTA DE DATOS veremos las
filas y columnas que contienen los datos.
Estudio de las variables del fichero de datos.
En el men superior, elegiremos:
ANALIZAR - > ESTADISTICOS DESCRIPTIVOS -> FRECUENCIAS
Obtendremos un rectngulo, a la izquierda, con la lista de variables disponibles y otro
rectngulo, a la derecha vaco. Las variables que pasemos del rectngulo de la derecha al de la
izquierda, sern con las que trabajar el programa en el paso siguiente.
En la parte inferior de este rectngulo hay tres botones:
ESTADSTICOS: permite elegir los estadsticos que queremos que calcule el SPSS en el
siguiente anlisis. Pulsando con el botn izquierdo se eligen los estadsticos y pulsando con el
derecho se obtiene informacin sobre cada estadstico.
GRFICOS: nos deja elegir entre los grficos disponibles
FORMATO: permite cambiar la presentacin de las tablas de frecuencias.
Se recomienda tomar nota de la distribucin de las frecuencias de cada una de las variables
nominales (sexo, centro, habitat, etc) y de las ordinales (estudios del padre, nivel
socioeconmico, etc), para el resto de las variables se recomienda usar:
ANALIZAR -> ESTADISTICOS DESCRIPTIVOS-> DESCRIPTIVOS, para conocer el valor
mximo, mnimo, media y desviacin tpica. Tratar de conocer otros estadsticos para las
variables cuantitativas.
Hacer las representaciones grficas mas adecuadas para cada variable.
Primero "a mano" y luego
Usando el SPSS, resuelve al menos los siguientes problemas :
2

Los resultados de 18 estudiantes en un test sobre hbitos de estudio han sido los siguientes:
154, 109, 138, 115, 154 , 140, 154, 178, 101, 103, 126, 127, 137, 165, 165, 129, 200, 148.
calcula la media, la moda, la mediana. Haz el grfico de cajas.
El nmero de horas de sol registradas en el mes de enero en 49 Estaciones meteorolgicas ha
sido: 83, 82, 78,72, 107, 107, 93, 72, 85, 98, 71, 76, 83, 72, 126, 102, 70, 112, 99, 155, 118,
150, 129, 119, 148, 181, 151, 167, 156, 180, 173, 149, 80, 131, 121, 110, 200, 162, 214, 176,
186, 187, 186, 141, 212, 186, 199, 198, 219.Forma una tabla de intervalos de amplitud 20
tomando 70 como extremo inferior del primer intervalo y determina media, mediana e intervalo
modal. Haz el histograma y el diagrama de cajas
A un grupo de 10 estudiantes se les hizo una prueba de razonamiento y otra de habilidad.
Calcular en qu prueba hubo mayor variabilidad de resultados, sabiendo que stos fueron:
Razonamiento: 40, 38, 65, 56, 16, 55, 28, 62, 32, 48
Habilidad:
36, 18, 54, 47, 21, 56, 68, 70, 72, 38.
Indicacin: comparar los coeficientes de variacin.,
Regresin lineal
Hacer las siguientes ejercicios, primero "a mano" y luego usando el SPSS.
El nmero de horas de estudio de una asignatura y la calificacin obtenida en el examen
correspondiente fue para siete personas, la siguiente:

Horas
5
8
10
12
15
17
18
Calificacin
3
6
5
6
9
7
9
Dibuja la nube de puntos y traza, aproximadamente, la recta de regresin asociada.
La tabla siguiente muestra para los aos que se indican, la natalidad por cada 1000
habitantes de una ciudad espaola.
Aos
1986 1987 1988 1989 1990 1991
Natalidad
21
21
20
18
16
15
Los aos se pueden poner como 1,2,3,4,5,6(para hacerlo a mano simplifica clculos)
Calcula: el coeficiente de correlacin y la ecuacin de la recta de regresin
Dibuja la nube de puntos
En la siguiente tabla aparece la evolucin del rcord del mundo de salto de longitud
masculina, en metros
Aos 1901 1921 1925 1931 1935 1961 1962 1968 1991
Marca 7,61 7,69 7,89 8,13 8,28 8,31 8,35 8,90 8,95
Los aos para hacerlo a mano se pueden poner: 1, 21,25,31,61,62,68 y 91
a) representa la nube de puntos asociada a estos datos
b) Calcula: el coeficiente de correlacin y la ecuacin de la recta de regresin
Instrucciones para hacer el primer ejercicio de regresin lineal con SPSS.

Introducir estos datos en el SPSS, las variables sern Horas y Califica


Nos vamos a GRFICOS -> DISPERSIN -> SIMPLE -> DEFINIR
3

Llevaremos la variable HORAS al eje X (variable independiente), y la variable


CALIFICA al eje Y(variable dependiente), pulsando ACEPTAR se obtendr la nube de
puntos.
Si se quiere cambiar la escala de los ejes X Y, se llevar el cursor sobre el grfico y se
pulsar el botn derecho del ratn. Se nos abrir un pequeo men del que eligiremos la
opcin Objeto grfico del SPSS -> abrir. EN el men superior abrir Diseo -> ejes.
Para cambiar la escala del eje X, sealar escala eje X y aceptar. Cambiar a los valores que
deseemos y hacer lo mismo con el eje Y.
Para obtener el coeficiente de correlacin y la ecuacin de la recta de regresin , se elige:
Analizar -> correlacin -> bivariada
Llevar las variables Horas y Califica al rectngulo de variables de la derecha y pulsar
aceptar y obtendremos el valor 088 del coeficiente de correlacin
Analizar -> Regresin - > lineal
Llevaremos Califica a variable dependiente y Horas a variable independiente y pulsamos
en aceptar.
Del ltimo cuadro de la salida del SPSS, podemos deducir la ecuacin de la recta de
regresin de Y sobre X.
Recordemos que la ecuacin de la recta que calculamos al hacer el problema era
Y== 039 X + 17 . Tanto la ordenada en el origen de la recta ( 1.656 como la pendiente
de la recta de regresin .393 los podemos encontrar en la ltima tabla de resultados,
aparecen en el recuadro Coeficientes no estandariazados, bajo la letra B.

ESTADSTICA BIVARIABLE (TABLAS DE CONTINGENCIA)


Para estudiar simultneamente dos variables as como la relacin entre las mismas es adecuado usar
las tablas de contingencia.
Una cuestin importante es llegar a conocer si las dos variables estudiadas son o no estadsticamente
independientes entre s o si por el contrario existe entre ellas alguna asociacin. (Hiptesis nula: las
variables son independientes).
Trabajaremos con el fichero ejemplo1, que ya debe estar en nuestro disquete. Elegiremos :
ANALIZAR -> ESTADSTICOS DESCRIPTIVOS -> TABLAS DE CONTINGENCIA
Habr que elegir una variable para las filas de la tabla y otra para las columnas. Es conveniente que
sean variables ordinales o nominales.
Los tres botones de la parte inferior:
ESTADSTICOS: permite elegir los estadsticos a calcular.(La explicacin de cada estadstico se obtiene
llevando el cursor sobre el nombre de estadstico y pulsando sobre el botn derecho del ratn)
CASILLAS: permite indicar el contenido de cada celda.
FORMATO: permite elegir el orden de las filas (ascendente o descendente)
El programa puede calcular el valor del estadstico 2 de Pearson (chi-cuadrado ) este
estadstico se basa en la comparacin entre las frecuencias observadas (las que se obtienen del

recuento de los datos del estudio) y las frecuencias esperadas (las que se deberan obtener si las
variables no estuvieran asociadas). La salida que se obtiene al pedir una chi cuadrado muestra el valor
del estadstico, los grados de libertad de la tabla (gl) , el nivel de significacin (Sig. Asinttica) que
equivale a la probabilidad de equivocarnos al rechazar la hiptesis nula que afirma que las variables son
independientes.
Conviene que antes de realizar el test fijemos el nivel de confianza que estimamos necesario para que
los resultados sean aceptables, por ejemplo:O,05 0,01. Estos valores no se introducen en el SPSS,
sirven para comparar con la significacin que calcula el SPSS a partir de nuestros datos. Si el nivel
prefijado es 0,05 y la significacin que obtiene el SPSS es menor que 0,05 habr que rechazar la
Hiptesis nula (la que afirma que las variables son independientes)
Significacin < 0,05 rechazamos H0 y concluiremos que las variables son dependientes entre s
Significacin > 0,05 aceptamos H0 y concluiremos que las variables son independientes entre s
Con podemos conocer si dos variables estn asociadas estadsticamente o no. Pero si el resultado
es afirmativo, no se conoce la fuerza de la asociacin. Para saber si la asociacin es fuerte o dbil se
emplean otros estadsticos.
Buscaremos parejas de variables para las que 2 confirme que son dependientes. ( estupa = Nivel de
estudios de los padres y nivsoc = Nivel socioeconmico familiar)
2

Para variables medidas en escala nominal:PHI es el coeficiente adecuado para tablas 2x2. V de
Cramer Es adecuado para tablas de dimensiones mayores, el coeficiente de contingencia: tiene la
pega de que no llega a valer 1
Los coeficientes anteriores son medidas simtricas de la fuerza de la asociacin y se interpretan
como el coeficiente de correlacin de Pearson R
La R de Pearson se usa para variables continuas (de intervalo) toma valores en el intervalo [-1,1]
Adems R2 mide la capacidad de la variable independiente para predecir la dependiente (cociente entre
la varianza explicada y la varianza total)
La RHO de Sperman solo debe aplicarse cuando las dos variables a comparar son ordinales y pueden
tomar muchos valores diferentes, mientras que las Tau-b, Tau-c y Gamma son mas adecuadas para
variables con pocas categoras. Estas variables son dependientes del tamao de la tabla, por lo que no
sirven para comparar tablas de distintas dimensiones.
La d de Sommer es una medida de asociacin asimtrica que indica la proporcin en que se reduce el
error al pronosticar una variable en funcin de la otra.
Hay pues dos tipos de medidas de asociacin : las simtricas y las asimtricas. Las simtricas se
interpretan como ndices del grado de asociacin entre dos variables, pero sin supeditar la una a la otra,
mientras que las asimtricas dan una medida del grado en que se reduce el error cuando se predice una
variable a partir de la otra. En este caso el/a investigador/a definir previamente cual es la variable
independiente (predictora) y cual es la variable dependiente (criterio)
RECODIFICACIN DE VARIABLES
Toda variable de intervalo se puede recodificar para ser transformada en variable ordinal.
Para trabajar con tablas de contingencia, a veces es interesante que los valores de las variables se
agrupen en pocas categoras. Para que un test de 2 sea vlido no debera haber celdas vacas y no
ms del 20% de las celdas deben tener una frecuencia menor o inferior a 5. Este problema se puede
resolver disminuyendo el nmero de categoras en los resultados de las variables o aumentando el
tamao de la muestra.
Vamos a ver cmo se recodifica una variable.
Veamos el caso concreto de la variable PAGA. Ya hemos podido comprobar que las pagas de las
personas de nuestra encuesta varan entre 6 y 30. Vamos a definir una nueva variable PAGA2 en la que

los resultados solamente sean 1, 2 o 3 (poco, regular y mucho). Haremos que los que tiene una paga
entre 6 y 14 en PAGA2 tengan un 1 y le pondremos una etiqueta de poco, los que tengan una paga
entre 15 y 23 en PAGA2 tengan asignado un 2 y le pondremos una etiqueta de regular y los que tiene
una PAGA 24 a 30, en PAGA2, les asignaremos un 3 y una etiqueta de mucho.
Los pasos a realizar son:
Con el fichero de datos cargado elegiremos en el men superior la opcin
TRANSFORMAR RECODIFICAR en distintas variables
Es importante NO elegir en la misma variable, pues en ese caso se pierde la informacin anterior y solo
nos quedamos con los valores de las tres categoras que vamos a definir, pero perderamos el valor de la
paga real.
Nos aparecer un rectngulo a la izquierda con la lista de todas las variables de nuestro fichero de datos,
pasaremos al rectngulo de la derecha las variables que vamos a recodificar, en este caso PAGA. En el
rectngulo Variable Resultado Nombre pondremos PAGA2, pulsaremos en el botn cambiar y en la
etiqueta pondremos PAGA CODIFICADA EN 3 NIVELES, pulsamos en valores antiguos y nuevos y en
RANGO pondremos de 6 hasta 14 valor nuevo 1 (aadir); de 15 hasta 23 valor nuevo 2 (aadir); de 24
hasta 30 valor nuevo 3 (aadir) y aceptar.
Al final de la lista de variables tiene que aparecer la nueva variable PAGA2 que acabamos de definir. En
la columna VALORES de esa nueva variable pincharemos para definir las etiquetas:
Valor 1 etiqueta valor poco (AADIR); VALOR 2, etiqueta valor regular (AADIR); VALOR 3, etiqueta
valor mucho (AADIR) Y ACEPTAR.
Para estar seguros de que todo ha ido bien podemos ver la distribucin de frecuencias de la nueva
variable PAGA2, en el men superior ANALIZAR ESTADISTICOS DESCRIPTIVOS FRECUENCIAS
Variables adecuadas para recodificar y alguna sugerencia para ello:
Nmero de hermanos: podemos hacer 3 grupos : pocos para 1 y 2, regular para 3 y 4, y muchos para
5,6 o 6.
En edad tambin 3 grupos el primero de 12 a 14, el segundo de 15 a 17 y el tercero de 18 a 20
Rendimiento escolar: recodificar a suspenso, aprobado, notable y sobresaliente.
Verbal hacer otra 3 categoras (18-26)(27-35)(36-45)
Libros ( de 2 a 6, de 7 a 12 y de 13 a 24)
Buscar los valores mximos y mnimos de CINE , TEATRO , CONCIERT Y tv y recodificarlas a 2 o tres
categoras. Dejar NIVSOC en solo 3 categoras: bajo, medio y alto.
Despus de las recodificaciones anteriores buscar entre todas las variables disponibles parejas de
variables que resulten ser independientes, o dependientes entre s y anotar cuales son. En las
dependientes estudiar adecuadamente la fuerza de la asociacin .

Comparacin de Medias
Este anlisis tiene como objetivo comparar si la media es significativamente diferente en diversas
variables o en distintos subgrupos de la misma variable .
El ms sencillo es el test de la t .
Para realizar estos anlisis se elige: Analizar -> comparar medias y las posibles opciones son: Medias,
Pruebas T para una muestra, Pruebas T para muestras independientes, pruebas T para muestras
relacionadas y Anova de un factor.
La primera opcin (Medias) nos permite una variable dependiente (por ejemplo paga semanal) y una
variable dependiente que haga subgrupos en la poblacin total, por ejemplo Nivel socioeconmico. Y da
la media y la desviacin tpica de las variables elegidas, en los subgrupos creados por el Nivel
socioeconmico y en la poblacin completa. As pues el procedimiento Medias calcula medias de

subgrupo y estadsticos univariados relacionados para variables dependientes dentro de las categoras
de una o ms variables independientes.
La segunda , El procedimiento Prueba T para una muestra contrasta si la media de una sola variable
difiere de una constante especificada por el investigador. Recordar que la decisin de aceptar la
Hiptesis nula (No hay diferencias significativas) se toma en funcin del nmero que aparece en la
casilla que da la significacin. Si el nmero de esa casilla es menor que el nivel mnimo aceptable
prefijado (por ejemplo: 0,05 o 0,01)se rechaza la H 0 y en caso contrario de acepta. Tambin nos da
este procedimiento un intervalo de confianza para la diferencia entre la media y el valor elegido por
nosotros.
El procedimiento Prueba T para muestras independientes compara las medias de dos grupos de
casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente a dos grupos, de forma
que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros
factores. Este caso no ocurre si se comparan los ingresos medios para hombres y mujeres. El sexo de
una persona no se asigna aleatoriamente. En estas situaciones, debe asegurarse de que las diferencias
en otros factores no enmascaren o resalten una diferencia significativa entre las medias. Las diferencias
de ingresos medios pueden estar sometidas a la influencia de factores como los estudios y no solamente
el sexo. Lo que decide si hay que considerar igual varianza lo da el nmero que aparece bajo Sig
(detrs de F). Lo que decide si los subgrupos tienen media significativamente distinta es el nmero que
aparece bajo Sig. Bilateral. La interpretacin de estos nmeros es la ya explicada previamente.
El procedimiento Prueba T para muestras relacionadas compara las medias de dos variables de un
solo grupo. Calcula las diferencias entre los valores de las dos variables de cada caso y contrasta si la
media difiere de 0. Es lgico elegir variables cuya media sea similar, en caso contrario carece de sentido
realizar esta prueba.
El procedimiento ANOVA de un factor genera un anlisis de varianza de un factor para una variable
dependiente cuantitativa respecto a una nica variable de factor (la variable independiente). El anlisis
de varianza se utiliza para contrastar la hiptesis de que varias medias son iguales. Esta tcnica es una
extensin de la prueba t para dos muestras, la diferencia es que ahora los grupos pueden ser mas de
dos. Pero la variable que hace los grupos (el factor) debe estar definida al menos como ordinal.

Trabajo con un fichero "grande"


Frecuentemente los ficheros que se emplean para investigaciones sociolgicas tienen su origen
en encuestas con muchas preguntas, de las que se obtienen muchas variables (no todas
interesantes para una investigacin concreta). Tambin a veces la muestra es muy grande.
Vamos a ver como reducir el nmero de variables y de casos con objeto de que aligerar los
clculos al SPSS.
Abrir el fichero CIS2409.
Dado el tamao de este fichero ( aproximadamente 100 variables y 2500 casos) y teniendo en
cuenta que estamos trabajando en red, no hay que ponerse nervioso si alguna vez el ordenador
se queda "colgado".
Para obtener informacin de las variables que contiene el fichero en UTILIDADES (men
superior) elegir variables o Informacin de archivo.
Este mismo men de utilidades ofrece dos posibilidades interesantes
7

Definir conjuntos: permite seleccionar las variables que se van a usar en el estudio
En primer lugar hay que dar nombre al conjunto y despus llevar del rectngulo de la izquierda
al de la derecha que est bajo el ttulo Variables del conjunto, las variables que nos interesen.
Pulsar aadir conjunto y cerrar.
La opcin usar conjunto nos permite usar los conjuntos definidos previamente. Para ello hay
que llevar el conjunto de inters al rectngulo conjuntos en uso. Si dejamos en el rectngulo
conjuntos en uso Allvariables, se usarn todas las variables y no ser efectiva la seleccin
efectuada en los conjuntos definidos previamente.
Se recomienda estudiar individualmente y por parejas las variables de la encuesta que se
piense pueden resultar interesantes para una investigacin sobre "EMIGRACIN" e ir
tomando notas de los resultados obtenidos.
Intervalos de confianza para la media
Analizar -> estadsticos descriptivos -> explorar
Llevar las variables de las que queremos conocer el intervalo de confianza al rectngulo
"Dependientes" (por ejemplo "simpata norte- africanos")
En estadsticos sealar descriptivos y el nivel de confianza se puede dejar al 95% o cambiarlo.
Si se desea tener un intervalo de confianza para los hombres y otro para las mujeres habr que
llevar la variable sexo al rectngulo "Factores"

Anlisis factorial con SPSS


Introducir como datos a analizar el fichero "Factorial".
Analizar -> Reduccin de datos -> Anlisis factorial
Las variables que introduciremos para realizar el AF, son: Velocidad de entrega, nivel de
precios, flexibilidad del precio, Imagen del fabricante, servicio, imagen del personal de ventas,
calidad del producto.
De las variables anteriores a la vista de los resultados que obtendremos es necesario eliminar
una de ellas.
En descriptivos (matriz de correlacin, seleccionar coeficientes, nivel de significacin,
determinante, KMO y prueba de esfericidad de Barlett, anti-imagen.
En extraccin: mtodo de componentes principales
Analizar matriz de correlaciones
8

Extraer autovalores mayores que 1


Mostrar solucin factorial sin rotar y grfico de sedimentacin.
Rotacin varimax (mostrar solucin rotada , grfico de saturaciones)
Opciones : excluir casos segn lista.

También podría gustarte