Está en la página 1de 9

Instrucciones para el uso del programa SPSS SPSS. Instrucciones para introducir los datos.

Sera interesante que cada alumno/a se traiga un disquete para guardar en l su trabajo Para aprender a introducir los datos, crearemos un pequeo fichero con los datos obtenidos a partir de las respuestas a una encuesta en la que al menos hay 4 preguntas. Edad, Sexo, Estudios y Salario. Tu puedes poner ms. Introduciremos al menos 5 variables, la primera nos servir de control y ser ncuest (nmero de cuestionario) y las siguientes sern las preguntas de la encuesta: Edad, Sexo, Estudios y Salario.etc. Primero definiremos estas variables y despus introduciremos las respuestas de unas cuantas encuestas ficticias o reales. Haciendo doble clic en el icono del SPSS entraremos en el programa y si nos ofrece varias opciones elegiremos la opcin INTRODUCIR DATOS y luego aceptar. Tambin es posible que directamente aparezcan las filas y columnas de una especie de hoja de clculo donde introduciremos los datos. En la parte inferior hay dos pestaas: vista de variables y vista de datos. Elegiremos vista de variables y nos situaremos en el rectngulo de la primera fila que est bajo NOMBRE e introduciremos en l el nombre de la primera variable ncuest . Luego siguiendo en la misma fila, bajo TIPO elegiremos el tipo de esta variable. Para ver los tipos posibles se pulsa en el cuadradito con puntos suspensivos. Para esta variable podemos elegir numrica con anchura 3 y con ningn decimal y pulsamos el botn aceptar. Debajo de etiqueta pondremos Nmero de cuestionario, las otra casillas se pueden quedar en blanco. En la fila segunda bajo NOMBRE pondremos el nombre de la segunda variable Edad , tipo numrico, anchura 3, decimales ninguno, en valores dejamos ninguno y en perdidos pondremos 999 (para los que no contesten a esta pregunta), en medida pondremos escala En la siguiente fila escribiremos el nombre de la siguiente variable, Sexo, en tipo pondremos cadena, en anchura pondremos 1 en etiqueta pondremos sexo del/a encuestado/a en valores el valor 1 le etiquetamos como mujer y se pulsa aadir y al valor 2 le etiquetamos como hombre, pulsar aadir y luego aceptar. Bajo perdidos pondremos 0 (para los que no respondan a esta pregunta). En medida poner nominal, En la fila siguiente pondremos Estudios y en tipo cadena en etiqueta pondremos estudios finalizados, bajo valores pondremos las siguientes etiquetas 0 para sin estudios , 1 para ESO, 2 para Mdulos FP grado medio, 3 para Bachillerato, 4 para Mdulos FP grado superior y 5 para Estudios Universitarios. En perdidos pondremos 9 para los que dejen sin contestar esta pregunta, en medida le pondremos ordinal En la siguiente fila pondremos Salario , tipo numrico, anchura 8, decimales 2, perdidos 9999, en medida escala. Antes de continuar, se guarda este trabajo, por si surgen problemas, que no lo perdamos. Se hace en la forma habitual de guardar un fichero en WINDOWS 1

En el MENU superior a la derecha pulsamos en Archivo, se despliega un men y pulsamos en GUARDAR COMO. Lo guardaremos en el disquete A, con el nombre que queramos, se sugiere, trabajo1. Si miramos debajo de la pantalla y nos cambiamos de la solapa vista de variables a vista de datos, aparecer una tabla en la que las variables que acabamos de definir aparecen en la primera fila. Lo nico que hay que hacer ahora es rellenar los datos en sus casillas correspondientes. Recordar que en sexo pondremos 1 a las mujeres, y 2 a los hombres, y 0 a los que no contesten. En Estudios usar los cdigos (0,1,2,3,4 y 5) que se introdujeron previamente. Cuando todo est completo guardarlo al disco como se hizo anteriormente. Para empezar a ver resultados: elegir Analizar (men superior) elegir Estadsticos descriptivos, frecuencias. Sealar las variables que nos interesa estudiar y pasarlas al rectngulo de la derecha. Trabajo con un fichero de datos ya creado. Copiar en el disquete A:, el fichero de datos (ejemplo1) que est en la carpeta Benita (dentro de la carpeta prcticas). Entrar en SPSS de la forma habitual y estando en el editor de datos, elegir en el men superior : ARCHIVO -> ABRIR -> DATOS Y abrir el fichero de datos que acabamos de copiar en nuestro disquete, A:ejemplo1 Pulsando en la pestaa inferior VISTA DE VARIABLES podemos ver las 18 variables que estn definidas en este fichero de datos y si pulsamos en la pestaa VISTA DE DATOS veremos las filas y columnas que contienen los datos. Estudio de las variables del fichero de datos. En el men superior, elegiremos: ANALIZAR - > ESTADISTICOS DESCRIPTIVOS -> FRECUENCIAS Obtendremos un rectngulo, a la izquierda, con la lista de variables disponibles y otro rectngulo, a la derecha vaco. Las variables que pasemos del rectngulo de la derecha al de la izquierda, sern con las que trabajar el programa en el paso siguiente. En la parte inferior de este rectngulo hay tres botones: ESTADSTICOS: permite elegir los estadsticos que queremos que calcule el SPSS en el siguiente anlisis. Pulsando con el botn izquierdo se eligen los estadsticos y pulsando con el derecho se obtiene informacin sobre cada estadstico. GRFICOS: nos deja elegir entre los grficos disponibles FORMATO: permite cambiar la presentacin de las tablas de frecuencias. Se recomienda tomar nota de la distribucin de las frecuencias de cada una de las variables nominales (sexo, centro, habitat, etc) y de las ordinales (estudios del padre, nivel socioeconmico, etc), para el resto de las variables se recomienda usar: ANALIZAR -> ESTADISTICOS DESCRIPTIVOS-> DESCRIPTIVOS, para conocer el valor mximo, mnimo, media y desviacin tpica. Tratar de conocer otros estadsticos para las variables cuantitativas. Hacer las representaciones grficas mas adecuadas para cada variable. Primero "a mano" y luego Usando el SPSS, resuelve al menos los siguientes problemas : 2

Los resultados de 18 estudiantes en un test sobre hbitos de estudio han sido los siguientes: 154, 109, 138, 115, 154 , 140, 154, 178, 101, 103, 126, 127, 137, 165, 165, 129, 200, 148. calcula la media, la moda, la mediana. Haz el grfico de cajas. El nmero de horas de sol registradas en el mes de enero en 49 Estaciones meteorolgicas ha sido: 83, 82, 78,72, 107, 107, 93, 72, 85, 98, 71, 76, 83, 72, 126, 102, 70, 112, 99, 155, 118, 150, 129, 119, 148, 181, 151, 167, 156, 180, 173, 149, 80, 131, 121, 110, 200, 162, 214, 176, 186, 187, 186, 141, 212, 186, 199, 198, 219.Forma una tabla de intervalos de amplitud 20 tomando 70 como extremo inferior del primer intervalo y determina media, mediana e intervalo modal. Haz el histograma y el diagrama de cajas A un grupo de 10 estudiantes se les hizo una prueba de razonamiento y otra de habilidad. Calcular en qu prueba hubo mayor variabilidad de resultados, sabiendo que stos fueron: Razonamiento: 40, 38, 65, 56, 16, 55, 28, 62, 32, 48 Habilidad: 36, 18, 54, 47, 21, 56, 68, 70, 72, 38. Indicacin: comparar los coeficientes de variacin., Regresin lineal Hacer las siguientes ejercicios, primero "a mano" y luego usando el SPSS. El nmero de horas de estudio de una asignatura y la calificacin obtenida en el examen correspondiente fue para siete personas, la siguiente:

Horas 5 8 10 12 15 17 18 Calificacin 3 6 5 6 9 7 9 Dibuja la nube de puntos y traza, aproximadamente, la recta de regresin asociada. La tabla siguiente muestra para los aos que se indican, la natalidad por cada 1000 habitantes de una ciudad espaola. Aos 1986 1987 1988 1989 1990 1991 Natalidad 21 21 20 18 16 15 Los aos se pueden poner como 1,2,3,4,5,6(para hacerlo a mano simplifica clculos) Calcula: el coeficiente de correlacin y la ecuacin de la recta de regresin Dibuja la nube de puntos En la siguiente tabla aparece la evolucin del rcord del mundo de salto de longitud masculina, en metros Aos 1901 1921 1925 1931 1935 1961 1962 1968 1991 Marca 7,61 7,69 7,89 8,13 8,28 8,31 8,35 8,90 8,95 Los aos para hacerlo a mano se pueden poner: 1, 21,25,31,61,62,68 y 91 a) representa la nube de puntos asociada a estos datos b) Calcula: el coeficiente de correlacin y la ecuacin de la recta de regresin
Instrucciones para hacer el primer ejercicio de regresin lineal con SPSS.

Introducir estos datos en el SPSS, las variables sern Horas y Califica Nos vamos a GRFICOS -> DISPERSIN -> SIMPLE -> DEFINIR
3

Llevaremos la variable HORAS al eje X (variable independiente), y la variable CALIFICA al eje Y(variable dependiente), pulsando ACEPTAR se obtendr la nube de puntos. Si se quiere cambiar la escala de los ejes X Y, se llevar el cursor sobre el grfico y se pulsar el botn derecho del ratn. Se nos abrir un pequeo men del que eligiremos la opcin Objeto grfico del SPSS -> abrir. EN el men superior abrir Diseo -> ejes. Para cambiar la escala del eje X, sealar escala eje X y aceptar. Cambiar a los valores que deseemos y hacer lo mismo con el eje Y. Para obtener el coeficiente de correlacin y la ecuacin de la recta de regresin , se elige: Analizar -> correlacin -> bivariada Llevar las variables Horas y Califica al rectngulo de variables de la derecha y pulsar aceptar y obtendremos el valor 088 del coeficiente de correlacin Analizar -> Regresin - > lineal Llevaremos Califica a variable dependiente y Horas a variable independiente y pulsamos en aceptar. Del ltimo cuadro de la salida del SPSS, podemos deducir la ecuacin de la recta de regresin de Y sobre X. Recordemos que la ecuacin de la recta que calculamos al hacer el problema era Y== 039 X + 17 . Tanto la ordenada en el origen de la recta ( 1.656 como la pendiente de la recta de regresin .393 los podemos encontrar en la ltima tabla de resultados, aparecen en el recuadro Coeficientes no estandariazados, bajo la letra B.

ESTADSTICA BIVARIABLE (TABLAS DE CONTINGENCIA) Para estudiar simultneamente dos variables as como la relacin entre las mismas es adecuado usar las tablas de contingencia. Una cuestin importante es llegar a conocer si las dos variables estudiadas son o no estadsticamente independientes entre s o si por el contrario existe entre ellas alguna asociacin. (Hiptesis nula: las variables son independientes). Trabajaremos con el fichero ejemplo1, que ya debe estar en nuestro disquete. Elegiremos : ANALIZAR -> ESTADSTICOS DESCRIPTIVOS -> TABLAS DE CONTINGENCIA Habr que elegir una variable para las filas de la tabla y otra para las columnas. Es conveniente que sean variables ordinales o nominales. Los tres botones de la parte inferior: ESTADSTICOS: permite elegir los estadsticos a calcular.(La explicacin de cada estadstico se obtiene llevando el cursor sobre el nombre de estadstico y pulsando sobre el botn derecho del ratn) CASILLAS: permite indicar el contenido de cada celda. FORMATO: permite elegir el orden de las filas (ascendente o descendente) El programa puede calcular el valor del estadstico de Pearson (chi-cuadrado) este estadstico se basa en la comparacin entre las frecuencias observadas (las que se obtienen del
2

recuento de los datos del estudio) y las frecuencias esperadas (las que se deberan obtener si las variables no estuvieran asociadas). La salida que se obtiene al pedir una chi cuadrado muestra el valor del estadstico, los grados de libertad de la tabla (gl) , el nivel de significacin (Sig. Asinttica) que equivale a la probabilidad de equivocarnos al rechazar la hiptesis nula que afirma que las variables son independientes. Conviene que antes de realizar el test fijemos el nivel de confianza que estimamos necesario para que los resultados sean aceptables, por ejemplo:O,05 0,01. Estos valores no se introducen en el SPSS, sirven para comparar con la significacin que calcula el SPSS a partir de nuestros datos. Si el nivel prefijado es 0,05 y la significacin que obtiene el SPSS es menor que 0,05 habr que rechazar la Hiptesis nula (la que afirma que las variables son independientes) Significacin < 0,05 rechazamos H0 y concluiremos que las variables son dependientes entre s Significacin > 0,05 aceptamos H0 y concluiremos que las variables son independientes entre s Con podemos conocer si dos variables estn asociadas estadsticamente o no. Pero si el resultado es afirmativo, no se conoce la fuerza de la asociacin. Para saber si la asociacin es fuerte o dbil se emplean otros estadsticos. Buscaremos parejas de variables para las que 2 confirme que son dependientes. ( estupa = Nivel de estudios de los padres y nivsoc = Nivel socioeconmico familiar)
2

Para variables medidas en escala nominal:PHI es el coeficiente adecuado para tablas 2x2. V de Cramer Es adecuado para tablas de dimensiones mayores, el coeficiente de contingencia: tiene la pega de que no llega a valer 1 Los coeficientes anteriores son medidas simtricas de la fuerza de la asociacin y se interpretan como el coeficiente de correlacin de Pearson R La R de Pearson se usa para variables continuas (de intervalo) toma valores en el intervalo [-1,1] Adems R2 mide la capacidad de la variable independiente para predecir la dependiente (cociente entre la varianza explicada y la varianza total) La RHO de Sperman solo debe aplicarse cuando las dos variables a comparar son ordinales y pueden tomar muchos valores diferentes, mientras que las Tau-b, Tau-c y Gamma son mas adecuadas para variables con pocas categoras. Estas variables son dependientes del tamao de la tabla, por lo que no sirven para comparar tablas de distintas dimensiones. La d de Sommer es una medida de asociacin asimtrica que indica la proporcin en que se reduce el error al pronosticar una variable en funcin de la otra. Hay pues dos tipos de medidas de asociacin : las simtricas y las asimtricas. Las simtricas se interpretan como ndices del grado de asociacin entre dos variables, pero sin supeditar la una a la otra, mientras que las asimtricas dan una medida del grado en que se reduce el error cuando se predice una variable a partir de la otra. En este caso el/a investigador/a definir previamente cual es la variable independiente (predictora) y cual es la variable dependiente (criterio) RECODIFICACIN DE VARIABLES Toda variable de intervalo se puede recodificar para ser transformada en variable ordinal. Para trabajar con tablas de contingencia, a veces es interesante que los valores de las variables se agrupen en pocas categoras. Para que un test de sea vlido no debera haber celdas vacas y no ms del 20% de las celdas deben tener una frecuencia menor o inferior a 5. Este problema se puede resolver disminuyendo el nmero de categoras en los resultados de las variables o aumentando el tamao de la muestra. Vamos a ver cmo se recodifica una variable. Veamos el caso concreto de la variable PAGA. Ya hemos podido comprobar que las pagas de las personas de nuestra encuesta varan entre 6 y 30. Vamos a definir una nueva variable PAGA2 en la que
2

los resultados solamente sean 1, 2 o 3 (poco, regular y mucho). Haremos que los que tiene una paga entre 6 y 14 en PAGA2 tengan un 1 y le pondremos una etiqueta de poco, los que tengan una paga entre 15 y 23 en PAGA2 tengan asignado un 2 y le pondremos una etiqueta de regular y los que tiene una PAGA 24 a 30, en PAGA2, les asignaremos un 3 y una etiqueta de mucho. Los pasos a realizar son: Con el fichero de datos cargado elegiremos en el men superior la opcin TRANSFORMAR RECODIFICAR en distintas variables Es importante NO elegir en la misma variable, pues en ese caso se pierde la informacin anterior y solo nos quedamos con los valores de las tres categoras que vamos a definir, pero perderamos el valor de la paga real. Nos aparecer un rectngulo a la izquierda con la lista de todas las variables de nuestro fichero de datos, pasaremos al rectngulo de la derecha las variables que vamos a recodificar, en este caso PAGA. En el rectngulo Variable Resultado Nombre pondremos PAGA2, pulsaremos en el botn cambiar y en la etiqueta pondremos PAGA CODIFICADA EN 3 NIVELES, pulsamos en valores antiguos y nuevos y en RANGO pondremos de 6 hasta 14 valor nuevo 1 (aadir); de 15 hasta 23 valor nuevo 2 (aadir); de 24 hasta 30 valor nuevo 3 (aadir) y aceptar. Al final de la lista de variables tiene que aparecer la nueva variable PAGA2 que acabamos de definir. En la columna VALORES de esa nueva variable pincharemos para definir las etiquetas: Valor 1 etiqueta valor poco (AADIR); VALOR 2, etiqueta valor regular (AADIR); VALOR 3, etiqueta valor mucho (AADIR) Y ACEPTAR. Para estar seguros de que todo ha ido bien podemos ver la distribucin de frecuencias de la nueva variable PAGA2, en el men superior ANALIZAR ESTADISTICOS DESCRIPTIVOS FRECUENCIAS Variables adecuadas para recodificar y alguna sugerencia para ello: Nmero de hermanos: podemos hacer 3 grupos : pocos para 1 y 2, regular para 3 y 4, y muchos para 5,6 o 6. En edad tambin 3 grupos el primero de 12 a 14, el segundo de 15 a 17 y el tercero de 18 a 20 Rendimiento escolar: recodificar a suspenso, aprobado, notable y sobresaliente. Verbal hacer otra 3 categoras (18-26)(27-35)(36-45) Libros ( de 2 a 6, de 7 a 12 y de 13 a 24) Buscar los valores mximos y mnimos de CINE , TEATRO , CONCIERT Y tv y recodificarlas a 2 o tres categoras. Dejar NIVSOC en solo 3 categoras: bajo, medio y alto. Despus de las recodificaciones anteriores buscar entre todas las variables disponibles parejas de variables que resulten ser independientes, o dependientes entre s y anotar cuales son. En las dependientes estudiar adecuadamente la fuerza de la asociacin .

Comparacin de Medias
Este anlisis tiene como objetivo comparar si la media es significativamente diferente en diversas variables o en distintos subgrupos de la misma variable . El ms sencillo es el test de la t . Para realizar estos anlisis se elige: Analizar -> comparar medias y las posibles opciones son: Medias, Pruebas T para una muestra, Pruebas T para muestras independientes, pruebas T para muestras relacionadas y Anova de un factor. La primera opcin (Medias) nos permite una variable dependiente (por ejemplo paga semanal) y una variable dependiente que haga subgrupos en la poblacin total, por ejemplo Nivel socioeconmico. Y da la media y la desviacin tpica de las variables elegidas, en los subgrupos creados por el Nivel socioeconmico y en la poblacin completa. As pues el procedimiento Medias calcula medias de

subgrupo y estadsticos univariados relacionados para variables dependientes dentro de las categoras de una o ms variables independientes. La segunda , El procedimiento Prueba T para una muestra contrasta si la media de una sola variable difiere de una constante especificada por el investigador. Recordar que la decisin de aceptar la Hiptesis nula (No hay diferencias significativas) se toma en funcin del nmero que aparece en la casilla que da la significacin. Si el nmero de esa casilla es menor que el nivel mnimo aceptable prefijado (por ejemplo: 0,05 o 0,01)se rechaza la H0 y en caso contrario de acepta. Tambin nos da este procedimiento un intervalo de confianza para la diferencia entre la media y el valor elegido por nosotros. El procedimiento Prueba T para muestras independientes compara las medias de dos grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse aleatoriamente a dos grupos, de forma que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros factores. Este caso no ocurre si se comparan los ingresos medios para hombres y mujeres. El sexo de una persona no se asigna aleatoriamente. En estas situaciones, debe asegurarse de que las diferencias en otros factores no enmascaren o resalten una diferencia significativa entre las medias. Las diferencias de ingresos medios pueden estar sometidas a la influencia de factores como los estudios y no solamente el sexo. Lo que decide si hay que considerar igual varianza lo da el nmero que aparece bajo Sig (detrs de F). Lo que decide si los subgrupos tienen media significativamente distinta es el nmero que aparece bajo Sig. Bilateral. La interpretacin de estos nmeros es la ya explicada previamente. El procedimiento Prueba T para muestras relacionadas compara las medias de dos variables de un solo grupo. Calcula las diferencias entre los valores de las dos variables de cada caso y contrasta si la media difiere de 0. Es lgico elegir variables cuya media sea similar, en caso contrario carece de sentido realizar esta prueba. El procedimiento ANOVA de un factor genera un anlisis de varianza de un factor para una variable dependiente cuantitativa respecto a una nica variable de factor (la variable independiente). El anlisis de varianza se utiliza para contrastar la hiptesis de que varias medias son iguales. Esta tcnica es una extensin de la prueba t para dos muestras, la diferencia es que ahora los grupos pueden ser mas de dos. Pero la variable que hace los grupos (el factor) debe estar definida al menos como ordinal.

Trabajo con un fichero "grande" Frecuentemente los ficheros que se emplean para investigaciones sociolgicas tienen su origen en encuestas con muchas preguntas, de las que se obtienen muchas variables (no todas interesantes para una investigacin concreta). Tambin a veces la muestra es muy grande. Vamos a ver como reducir el nmero de variables y de casos con objeto de que aligerar los clculos al SPSS. Abrir el fichero CIS2409. Dado el tamao de este fichero ( aproximadamente 100 variables y 2500 casos) y teniendo en cuenta que estamos trabajando en red, no hay que ponerse nervioso si alguna vez el ordenador se queda "colgado". Para obtener informacin de las variables que contiene el fichero en UTILIDADES (men superior) elegir variables o Informacin de archivo. Este mismo men de utilidades ofrece dos posibilidades interesantes 7

Definir conjuntos: permite seleccionar las variables que se van a usar en el estudio En primer lugar hay que dar nombre al conjunto y despus llevar del rectngulo de la izquierda al de la derecha que est bajo el ttulo Variables del conjunto, las variables que nos interesen. Pulsar aadir conjunto y cerrar. La opcin usar conjunto nos permite usar los conjuntos definidos previamente. Para ello hay que llevar el conjunto de inters al rectngulo conjuntos en uso. Si dejamos en el rectngulo conjuntos en uso Allvariables, se usarn todas las variables y no ser efectiva la seleccin efectuada en los conjuntos definidos previamente. Se recomienda estudiar individualmente y por parejas las variables de la encuesta que se piense pueden resultar interesantes para una investigacin sobre "EMIGRACIN" e ir tomando notas de los resultados obtenidos. Intervalos de confianza para la media Analizar -> estadsticos descriptivos -> explorar Llevar las variables de las que queremos conocer el intervalo de confianza al rectngulo "Dependientes" (por ejemplo "simpata norte- africanos") En estadsticos sealar descriptivos y el nivel de confianza se puede dejar al 95% o cambiarlo. Si se desea tener un intervalo de confianza para los hombres y otro para las mujeres habr que llevar la variable sexo al rectngulo "Factores"

Anlisis factorial con SPSS Introducir como datos a analizar el fichero "Factorial". Analizar -> Reduccin de datos -> Anlisis factorial Las variables que introduciremos para realizar el AF, son: Velocidad de entrega, nivel de precios, flexibilidad del precio, Imagen del fabricante, servicio, imagen del personal de ventas, calidad del producto. De las variables anteriores a la vista de los resultados que obtendremos es necesario eliminar una de ellas. En descriptivos (matriz de correlacin, seleccionar coeficientes, nivel de significacin, determinante, KMO y prueba de esfericidad de Barlett, anti-imagen. En extraccin: mtodo de componentes principales Analizar matriz de correlaciones 8

Extraer autovalores mayores que 1 Mostrar solucin factorial sin rotar y grfico de sedimentacin. Rotacin varimax (mostrar solucin rotada , grfico de saturaciones) Opciones : excluir casos segn lista.

También podría gustarte