Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Manual de SPSS Nivel Bsico
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
INDICE
Prlogo ...................................................................................................................................................... 4 1 INTRODUCCIN A SPSS ............................................................................................................... 5 1.1 Tipos de ventana ......................................................................................................................... 6 1.2 Los cuadros de dilogo ............................................................................................................... 7 2 LOS DATOS ................................................................................................................................... 11 2.1 DEFINICIN DE VARIABLES Y CASOS............................................................................ 11 2.1.1 Variables cualitativas y cuantitativas ................................................................................ 12 2.1.2 Atributos de variable ......................................................................................................... 12 2.2 INTRODUCCIN DE DATOS ............................................................................................... 14 2.3 EDICIN DE DATOS ............................................................................................................. 15 2.4 LEER DATOS .......................................................................................................................... 16 2.4.1 LEER DATOS DE WORD PARA WINDOWS .............................................................. 16 2.4.2 LEER DATOS EN FORMATO ASCII (TEXTO) ........................................................... 18 3 CREACIN Y TRANSFORMACIN DE DATOS ..................................................................... 21 3.1 CREACIN DE VARIABLES (COMPUTE) ......................................................................... 21 3.1.1 Creacin de nuestra primera variable ................................................................................ 22 3.1.2 Creacin de una variable condicional ............................................................................... 23 3.2 RECODIFICACIN DE VARIABLES (RECODE) ............................................................... 24 3.2.1 Ejemplo de recodificacin. ............................................................................................... 25 3.3 RECODIFICACIN AUTOMATICA (AUTORECODE) ..................................................... 25 3.4 CATEGORIZADOR VISUAL ................................................................................................ 27 3.5 ASIGNAR RANGOS A CASOS (RANK) .............................................................................. 29 3.5.1 Rangos por grupos ............................................................................................................ 31 3.6 CONTAR CASOS (COUNT) .................................................................................................. 31 3.7 VALORES PRDIDOS (MISSING) ....................................................................................... 33 3.7.1 Valores perdidos determinados por el usuario .................................................................. 33 4 SELECCIN DE CASOS O GRUPOS .......................................................................................... 35 4.1 SEPARACIN DE CASOS (SPLIT FILE) ............................................................................. 35 4.2 FILTRADO DE CASOS (SELECT CASE) ............................................................................ 36 4.3 PONDERAR CASOS (WEIGHT CASES) .............................................................................. 38 4.4 ORDENAR CASOS (SORT) ................................................................................................... 39 5 ESTADSTICA. INTRODUCCIN .............................................................................................. 40 6 ESTADSTICA DESCRIPTIVA .................................................................................................... 41 6.1 DESCRIPCIN DE VARIABLES (FREQUENCIES) ........................................................... 41 6.1.1 Descripcin de variables nominales .................................................................................. 42 6.1.2 Descripcin de variables ordinales ................................................................................... 45 6.1.3 Descripcin de variables de intervalo ............................................................................... 46 6.2 DESCRIPCIN DE VARIABLES POR GRUPOS (MEANS) ............................................... 48 6.2.1 Descripcin jerrquica de variables por grupo ................................................................. 49 6.2.2 Grfico agrupado (de barras) ............................................................................................ 50 6.3 DESCRIPCIN RPIDA DE VARIABLES CUANTITATIVAS (DESCRIPTIVES) ......... 52 6.4 DESCRIPCIN DETALLADA DE VARIABLES Y GRUPOS (EXAMINE) ...................... 53 6.4.1 Grfico de tallo y hojas ..................................................................................................... 54 6.4.2 Grfico de cajas ................................................................................................................. 55 6.4.3 El caso extremo y la necesidad de eliminarlo ................................................................... 55 6.4.4 Grfico agrupado (de cajas) .............................................................................................. 56 6.5 VARIABLES MULTIRESPUESTA (MULT RESPONSE) ................................................... 57 Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 6.5.1 Definicin de variables dicotmicas ................................................................................. 58 6.5.2 Definicin de variables mltiples (categricas) ................................................................ 59 6.5.3 Distribucin de frecuencias ............................................................................................... 60 6.5.4 Tablas de contingencia ...................................................................................................... 61 7 ESTADSTICA INFERENCIAL .................................................................................................... 64 7.1 Introduccin a la estadstica inferencial ................................................................................... 64 7.2 Prueba T y Pruebas de hiptesis ............................................................................................ 64 7.3 Comparacin de medias ........................................................................................................... 65 7.3.1 Prueba T para una muestra ................................................................................................ 65 7.3.2 Prueba T para muestras independientes ............................................................................ 68 7.3.3 Prueba T para muestras relacionadas ................................................................................ 71 7.3.4 ANOVA de un factor (Anlisis de varianza) .................................................................... 73 7.3.4.1 Comparacin Post Hoc .................................................................................................. 75 7.3.4.2 Grfico ........................................................................................................................... 76 8 TABLAS DE CONTINGENCIA.................................................................................................... 77 8.1 El caso simple ............................................................................................................................. 78 8.2 Grfico ........................................................................................................................................ 80 8.3 El caso complejo ......................................................................................................................... 80 8.3.1 Estadstico X (Chi cuadrado) ........................................................................................ 81 8.3.2 Estadstico exacto de Fisher .............................................................................................. 82 8.3.3 Phi y V de Cramer ............................................................................................................. 82 9 ANLISIS DE CORRELACIN LINEAL ................................................................................... 82 9.1 Correlacin Bivariada ................................................................................................................. 83 9.2 Correlacin Parcial ...................................................................................................................... 85 9.3 Grfico de dispersin .................................................................................................................. 86 10 REGRESIN .................................................................................................................................. 88 10.1 Regresin Lineal Simple .......................................................................................................... 89 10.2 Regresin Lineal Mltiple ........................................................................................................ 92 10.3 Estimaciones Curvilineas ......................................................................................................... 93 10.3.1 Estimacin Exponencial .................................................................................................... 93 10.3.2 Estimacin logartmica ..................................................................................................... 95 10.3.3 Estimacin cuadrtica ....................................................................................................... 96 10.3.4 Estimacin cbica ............................................................................................................. 97 Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n SPSS (Statistical Product and Service Solutions) para Windows es un programa de ordenador que se utiliza para realizar una gran variedad de anlisis estadsticos, desde los ms sencillos a los ms extensos, SPSS ofrece un sistema eficiente y fcil de usar para organizar y analizar datos, es por tal motivo uno de los programas estadsticos ms utilizados tanto en el mundo acadmico como en el de los negocios en todo el mundo. La versin del programa SPSS que se describe es la que se usa en ordenadores en el entorno Windows. El manual se ha realizado en base a la versin 12.0 del programa SPSS para Windows, el cual puede ser instalado en las versiones Windows 95, Windows 98, Windows 2000, Windows NT y Windows XP, para la versin de Windows Vista debers contar con la versin ms reciente de SPSS que durante la realizacin de este manual la ltima versin es la 15.0. El propsito del manual y del curso es doble: ensear el manejo del SPSS para Windows y exponer los conceptos estadsticos necesarios para entender los resultados que produce el programa, el nivel del curso es bsico-intermedio. Con respecto al programa el enfoque del curso es simplificar su uso explicando los elementos ms importantes y esenciales tanto en relacin con los cuadros de dilogo como con las sentencias; y con respecto a la estadstica es, tambin, explicar de la manera ms sencilla los principales conceptos estadsticos. Por otro lado se supondr que el alumno tiene los conocimientos necesarios para trabajar en el entorno Windows, es decir, deber saber trabajar con archivos y carpetas, y trabajar con los diferentes dispositivos de almacenamiento, por lo que en este manual se omitir explicar la manera en que se guardaran los diferentes elementos de los que SPSS hace uso. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
SPSS organiza sus datos y resultados en varias ventanas de trabajo o de lectura, de las cuales las dos principales que encontramos cuando accedemos al programa son: la ventana de editor de datos y la venta de visor de resultados, y cada una de ellas se identifica en la barra de ttulo con un botn. La ventana del editor de datos es la principal de SPSS, pues ser en donde se introducirn los datos que queramos estudiar, esta ventana al ser guardada automticamente se le asignara la extensin (*.sav) donde el asterisco determina el nombre que el usuario decida agregar. El visor de resultados se generara automticamente cuando se decida realizar algn anlisis con los datos existentes en la ventana de editor de datos, esta nueva ventana al ser guardada automticamente se le asignara la extensin (*.spo). SPSS hace uso de otras cuatro ventanas, el editor de sintaxis, el editor de grficas, el visor borrador y el editor de autoprocesos, de las cuales no profundizaremos. Con SPSS puedes trabajar de dos maneras, con cuadros de dilogo o con comandos. Los comandos son una alternativa a los cuadros de dilogo. El editor de sintaxis se emplea para procesar los comandos. El editor de grficas le sirve para cambiar el aspecto de las grficas. El visor borrador es una manera alternativa de ver los resultados. El editor de autoprocesos le permite automatizar los resultados del visor SPSS. SPSS para Windows y como todas las ventanas de cualquier programa que trabajan bajo el entorno Windows tienen, aunque con diferentes herramientas el mismo tipo de barras de trabajo y por ende el mismo nombre: barra de ttulo, que es la que nos servir para identificar el nombre que nosotros le asignemos a esa ventana y contendr algunos botones de control (minimizar, restaurar, maximizar y cerrar); barra de mens, que es en donde encontraremos una serie de botones de men de los cuales se encontrarn todas las herramientas de las que SPSS hace uso (archivo, edicin, ver, datos, etc.); barra de herramientas, que es en donde encontraremos algunas herramientas de las que SPSS hace uso frecuentemente; barra de pestaas, en la cual estn contenidas dos pestaas, visor de datos y el visor de variables y; la barra de estado, la cual principalmente nos dar informacin de cuando un anlisis este en proceso y en su caso informara del termino de este. c o n t i n u a
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n c o n t i n u a c i n
- 1: Barra de ttulo. - 2: Barra de mens. - 3: Barra de herramientas. - 4: Barra de fichas. - 5: Barra de estado. Al iniciar una sesin con el SPSS nos encontramos con una ventana de aspecto similar al de una hoja de clculo (ver figura): el Editor de datos. El Editor de datos es la ventana principal del SPSS, pero no la nica. En los prximos captulos iremos explicando con detalle algunas de las diferentes ventanas de SPSS, pero antes, en este captulo, debemos hacernos una idea general del conjunto de las mismas. Conocer las distintas ventanas del SPSS es, probablemente, la mejor manera de aproximarnos por primera vez al programa y obtener una idea global sobre la estructura del mismo. 1.1 Tipos de ventana Existen ocho tipos de ventanas SPSS, aunque no todas ellas poseen la misma importancia desde el punto de vista de su utilidad para el usuario. Las dos ventanas principales (imprescindibles para trabajar con el SPSS) son: - El Editor de datos. Contiene el archivo de datos sobre el que se basa la mayor parte de las acciones que es posible llevar a cabo con el SPSS. El Editor de datos se abre automticamente (vaci, sin datos; ver figura) cuando se entra en el SPSS. La ventana del Editor de datos puede mostrar dos contenidos diferentes: los datos propiamente dichos y las variables del archivo c ont i nua acompaadas del conjunto de caractersticas que las definen. Es posible abrir ms 5
4 3 1
2 1
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n de un Editor de datos y, por lo tanto, trabajar con varios archivos de datos simultneamente; no obstante, los datos que interese analizar juntos debern estar en el mismo archivo. - El Visor de resultados. Recoge toda informacin (estadsticos, tablas, grficos, etc.) que el SPSS genera como consecuencia de las acciones que lleva a cabo. El Visor permite editar los resultados y guardarlos para su uso posterior. Es posible tener abiertas ventanas del Visor asociadas a cada Editor de datos.
Los resultados del Visor adoptan tres formatos distintos: tablas, grficos y texto. El SPSS dispone de un editor (y, por tanto, una ventana distinta) para cada uno de estos tres formatos bsicos: El Editor de tablas. Ofrece mltiples posibilidades de edicin de los resultados presentados en formato de tabla pivotante (un tipo particular de formato que estudiaremos mas adelante). El Editor de grficos. Permite modificar los colores, los tipos de letra, las etiquetas, la posicin de los ejes y muchos otros detalles de los grficos del Visor. El Editor de texto. Permite modificar los diferentes atributos (tipo, tamao, color, etc., de las fuentes) de los resultados tipo texto: ttulos, subttulos, y notas.
El resto de ventanas SPSS son las siguientes: - El Borrador del Visor de resultados. Ofrece la misma informacin que el Visor en modo normal, pero en formato texto, es decir, con un aspecto menos depurado y sin las posibilidades de edicin del Visor en modo normal (no es posible, por ejemplo, pivotar tablas o editar grficos). - El Editor de sintaxis. Permite utilizar las posibilidades de programacin del SPSS. Las acciones que el SPSS lleva a cabo como resultado de las selecciones hechas en los mens y cuadros de dilogo se basan en un conjunto de instrucciones construidas con una sintaxis propia del SPSS. Estas instrucciones en sintaxis SPSS pueden pegarse en una ventana de sintaxis desde cualquier cuadro de dilogo. El botn Pegar disponible en la mayor parte de los cuadros de dilogo siempre tiene el mismo efecto: convierte en sintaxis SPSS las selecciones hechas. La sintaxis SPSS pegada puede editarse para, por ejemplo, ejecutar algunas acciones no disponibles desde los cuadros de dilogo, o para salvarla en un archivo y volver a utilizarla en una sesin diferente. Es posible tener abiertas simultneamente varias ventanas de sintaxis. - Editor de procesos. Permite personalizar y automatizar algunas de las tareas que el SPSS lleva acabo, especialmente en lo relacionado con el contenido y el aspecto de las tablas de resultados.
1.2 Los cuadros de dilogo En todo momento que realices algn anlisis de datos haciendo uso de cualquier herramienta de las que SPSS te ofrece, comnmente tendrs que vrtelas con diferentes cuadros de dilogo y generalmente en todos los cuadros de dilogo hay botones que tienen el siguiente significado:
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Figura 2: Cuadro de dilogo
Aceptar: Realiza las operaciones de acuerdo a lo definido. Pegar: Escribe la sintaxis correspondiente a lo definido en la ventana de sintaxis. Restablecer: Cuando se usa por segunda vez un cuadro de dilogo, ste conserva las definiciones de la primera vez, si se pulsa este botn se eliminan esas definiciones. Cancelar: Cancela las definiciones en curso y sale del cuadro. Ayuda: Provee ayuda sobre el cuadro de dilogo.
Botones de acceso a cuadros de dilogo secundarios Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Cuando en una seccin de un cuadro haya varias opciones sealadas con crculos slo se puede elegir una (como en la seccin Mostrar de la figura 2), y cuando haya varias opciones sealadas con cuadrados se elegir cada una de ellas (como en la seccin Descriptivo del cuadro de dilogo siguiente), ah se puede elegir Tallo y hojas o/y Histograma, o bien ninguna de ellas.
Contnuar: Acepta lo definido en este cuadro y vuelve al cuadro de dilogo principal. Cancelar: Cancela lo definido en este cuadro y vuelve al cuadro de dilogo principal. Ayuda: Provee ayuda sobre las secciones del cuadro de dilogo.
Se puede elegir cada una de ellas Slo se puede elegir una de las cuatro posibilidades Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
- 1: En este apartado del cuadro de dilogo se encontraran el nombre de cada una de las variables con las que cuenta tu plantilla, por lo tanto sern con las que podrs trabajar, notaras que del lado izquierdo del nombre de la variable hay un smbolo, entonces la variable que contenga este smbolo ser aquella que hace uso de valores numricos, por ende se trata de una variable numrica; la variable que este precedida por este smbolo ser aquella que hace uso de valores alfanumricos, por ende se trata de una variable alfanumrica. - 2: En este apartado del cuadro de dilogo encontraremos un botn que dependiendo de la accin que deseemos realizar, este se transformara, cuando el botn se encuentre de esta manera significa que podemos agregar una variable del apartado 1 al apartado 2, simplemente seleccionando la variable y presionando el botn; cuando el botn se encuentre de esta manera querr decir que agregamos una variable al apartado 3, por ende podemos regresarla al apartado 1, seleccionando la variable y presionando el botn. - 3 En este apartado, se encontraran aquellas variables de las que con anterioridad agregamos con los botones del apartado 2, entonces nica y exclusivamente sern analizadas aquellas variables que estn agregadas en este apartado.
1
2
3
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Antes de iniciar una sesin de anlisis de datos, stos deben ser introducidos en el programa. Existen muchas formas distintas de administrar datos al programa. Desde la introduccin directa por el teclado, la lectura de un archivo, la importacin de datos de otras aplicaciones, el cortado y pegado desde otra tabla de datos, hasta una potente herramienta de consultas a otras bases de datos (MSAccess, Excel, Dbase, etc) a travs del servidor ODBC de Windows. Antes de continuar profundizando en los entresijos del programa, se presentan dos conceptos clave que aparecern recurrentemente durante el resto del documento y conviene detenerse en su clarificacin: variables y casos. 2.1 DEFINICIN DE VARIABLES Y CASOS
Todo conjunto de datos puede ser visto como una matriz. Las filas se corresponden con los distintos sujetos o unidades de investigacin, sobre los que se han realizado las distintas observaciones. stas ltimas se corresponden con las columnas. Los sujetos (filas) suelen denominarse casos y las observaciones (columnas) suelen denominarse variables. A modo de ejemplo, se emplea una investigacin en la que se analiza la relacin entre ciertas variables demogrficas, como el gnero, la edad, el estado civil, la ciudad de procedencia, y otras variables como nmero de individuo encuestado e ingreso mensual. Figura 4: Variables y casos
1) Nombre de la variable. 2) Nmero de caso, que corresponder a cada uno de los datos de las columnas variables. 1
2 Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Cuando empecemos a trabajar con SPSS estaremos en la ventana de editor de datos, que es donde introduciremos cada uno de los datos que se analizarn. En la parte inferior hay dos solapas o pestaas: Vista de datos (para introducir los datos) y Vista de variables (para definir los atributos de cada una de las variables). Por lo tanto, para definir las variables, pulsa en la solapa Vista de variables. En la vista de variables cada lnea definir una variable y las columnas son los diferentes atributos de la o las variables que podremos manipular. 2.1.1 Variables cualitativas y cuantitativas Las variables cualitativas (nominales) son variables de cuyos valores slo se puede decir que son distintos y que tienen valores que son arbitrarios y que por lo tanto tienen que ser convenidos de antemano, as la variable CIUDAD contendr los valores 1, 2 y 3, pero estos valores por si solos no nos dicen algo, por lo tanto los valores de una variable cualitativa no son autoexplicativos pues no sabremos que ciudad corresponde al nmero 1 o al 2 o al 3, entonces haciendo uso del atributo Valores (que veremos ms adelante) podremos determinar que le corresponde a cada valor, por ejemplo las personas que sean del Distrito Federal tendrn el valor 1, las de Monterrey el valor 2, y las de Guadalajara el 3. Las variables cuantitativas no reciben valores arbitrarios porque son autoexplicativos, es decir si un caso tiene 33 en la variable EDAD es que tiene 33 aos. Las variables cuantitativas se dividen en: 1) Ordinales: Los valores son distintos y se pueden ordenar. 2) Intervalo: Adems de ser valores distintos y que se pueden ordenar existe una unidad comn. 3) De razn: adems de los rasgos anteriores existe un cero real. 2.1.2 Atributos de variable Antes de que describamos cada uno de los diferentes atributos de las variables es muy importante tener en cuenta lo que a continuacin te expondr: Una variable de SPSS, puede tener hasta 64 letras como mximo, debe empezar por una letra, puede contener cualquier letra o nmero y no debe contener ningn carcter especial como guin, la coma o el signo de interrogacin; si puede contener acentos, guin bajo, el punto, el signo de $ o el signo @. No puede haber dos variables con el mismo nombre. Entonces, nombres vlidos, por ejemplo, son: VAR000001, VAR8, PESO, PRECIO_2, C@123, MONEDA$. A continuacin describiremos cada uno de los diferentes atributos que podemos agregar a cada una de las variables con las cuales trabajaremos en SPSS. 1) Columna Nombre: En esta columna agregaremos el nombre de las variables, el nombre de una variable puede tener hasta 64 letras como mximo, debe empezar por una letra, puede contener cualquier letra o nmero y no debe contener ningn carcter especial como guin, la coma o el signo de interrogacin; si puede contener acentos, guin bajo, el punto, el signo de $ o el signo @. No puede haber dos variables con el mismo nombre. Entonces, nombres vlidos, por ejemplo, son: VAR000001, VAR8, PESO, PRECIO_2, C@123, MONEDA$. Ahora, cuando se omite agregar nombre Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n a una variable y se agregan datos, este automticamente ser VAR00001, para la primera variable sin nombre, para una segunda variable sin nombre ser VAR00002 y as sucesivamente. 2) Columna Tipo: Cuando es nombrada una variable, observaras que SPSS automticamente la define como una variable Numrica. Si deseas modificar el tipo de variable, pulsa sobre este botn . Aparecer el cuadro de dilogo Tipo de variable: 3) Columna Anchura: Esta columna determina el ancho de nmeros con respecto a una variable Numrica, y SPSS automticamente a una variable Numrica le asigna un ancho de 8 dgitos. Puedes modificar la anchura desde la propia Vista de variables desde este botn que aparecer cuando te desplaces a la columna Anchura o desde el cuadro de dilogo Tipo de variable. 4) Columna Decimales: En esta columna se determina el nmero de dgitos decimales que contendr una variable Numrica, SPSS automticamente asigna dos nmeros decimales de los 8 dgitos que fueron determinados en la columna anchura. Puedes modificar el nmero de decimales desde la propia Vista de variables desde este botn que aparecer cuando te desplaces a la columna Decimales o desde el cuadro de dilogo Tipo de variable. 5) Columna Etiqueta: Esta columna es una de las ms importantes, pues en ella podrs escribir una pequea descripcin de la variable que muchas de las veces el propio nombre de la variable no describir, esta descripcin es empleada en el visor cuando se use esa variable. 6) Columna Valores: Cuando los datos de una variable no son autoexplicativos es necesario hacer uso de la columna Valores, en la cual podremos definir los valores que tendrn hombres y mujeres. Para definir los valores de la variable GENERO sitese en la columna Valores y pulse en el botn . Aparece el cuadro de dilogo Etiquetas de valor donde en la casilla Valor, deberas teclear el nmero, y en la casilla Etiqueta de valor Teclear la etiqueta y despus pulsar el botn Aadir. Y as para cada uno de los valores que se quieran etiquetar. Finalmente pulsar el botn aceptar. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
7) Columna Perdidos: En algunas investigaciones no se obtienen todos los datos para cada caso. En este caso se suele pedir un valor, que indica esa circunstancia, en las posiciones que ocuparan los valores de la variable cuyos datos faltan. Es muy usual codificar de una manera las respuestas no sabe o no contesta. Esto se maneja con la columna Perdidos de Vista de variables. 8) Columna Columnas: Nos servir para controlar la anchura de la columna de esa variable en la vista de datos. No confundas anchura de la columna y la anchura de la variable pues son cosas muy diferentes. 9) Columna Alineacin: En esta columna podremos determinar la alineacin de los datos que nuestro visor de datos contenga, pues los podremos alinear del lado derecho que es la forma predeterminada, o si los queremos centrados o alineados a la izquierda, y bastara situarnos en la columna alineacin y pulsar en el botn . 10) Columna Medida: Esta columna servir para determinar que tipo de valores es el que contendr esa variable, es decir si ser escalar, ordinal o nominal (ver variables cualitativas y cuantitativas), podrs elegir un tipo de valor situndote en la columna Medida y pulsar en el botn .
2.2 INTRODUCCIN DE DATOS Una vez definidos los atributos de cada una de las variables que contendr tu plantilla se pasa a introducir los datos. Entonces pulsa en la pestaa Vista de datos, y tomando como ejemplo la figura 4, donde se hace uso de un archivo llamado Encuesta.sav define las variables ID, EDAD, INGRESO, EDO_CIVIL, GENERO y CIUDAD, una vez echo esto teclea el nmero y pulsa la tecla Enter, el nmero aparecer en la casilla y resaltada la casilla inferior. Adems del ratn, se pueden emplear las teclas de direccin | y + para moverse por la cuadricula. Las etiquetas aadidas van apareciendo aqu Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Una vez insertados todos los datos de la primera columna (variable id) se continua con la siguiente columna situndose en la primera casilla del caso 1 en la variable EDAD, y as sucesivamente para cada una de las variables restantes. 2.3 EDICIN DE DATOS Veamos ahora las principales caractersticas del editor de datos (vista de datos). Aunque lo que sigue est pensado para aplicarse en la vista de datos la mayora de las funciones tambin son operativas en la vista de variables. Muchas de las funciones que se nombraran en este capitulo se harn de la misma forma que en una hoja de clculo de Excel, entonces en estos casos solo veras del lado derecho la leyenda como en Excel. - Para moverse emplear las flechas de movimiento. La tecla TAB cambia a la casilla contigua. Adems, para ir a la primera columna pulsar CTRL + . Para ir a la ultima columna CTRL. + . Para ir al principio (primera columna, primera lnea), pulsar CTRL. + INICIO. Para ir al final (ltima columna, ltima lnea) pulsar CTRL. + FIN. - Para ir a un caso concreto elegir del men Datos Ir a caso o pulsar el icono . - Para corregir un dato completamente, igual que en Excel. - Para corregir un dato parcialmente, igual que en Excel. - Para seleccionar. o Una celdilla, igual que en Excel. o Un caso (fila), hacer clic sobre la casilla del nmero del caso. o Una variable (columna), hacer clic sobre la casilla del nombre de la variable. o Un rectngulo de datos (rango), igual que en Excel. - Para buscar un dato de alguna variable, hay que situarse en la columna de la variable y elegir Edicin Buscar, o teclear Ctrl + F, o bien emplear el icono. A continuacin se nombraran todas las funciones tpicas de cualquier editor que en SPSS podrs hacer uso, y que en este curso se dar por hecho que las puedes manejar sin ningn problema, por ende solo sern mencionadas, y son: - Copiar una celda. - Mover una celda. - Copiar una celda a varias filas y/o columnas. - Copiar todos los datos de un caso a otro caso. - Copiar los datos de un caso a un caso nuevo. - Mover un caso a otro sitio. - Copiar una variable sobre otra. - Copiar una variable a otro sitio. - Mover una variable a otro sitio. - Copiar un rango de celdas. - Borrar. - Borrarlo todo. - Deshacer. - Rehacer. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 2.4 LEER DATOS Comnmente trabajaremos sobre archivos de datos que fueron guardados con anterioridad y para elegirlos en SPSS como en cualquier otro tipo de programas que trabajan bajo el entorno Windows se harn de la siguiente manera, elegir Archivo Abrir Datos, o usar el icono de abrir en la barra de herramientas. Al realizar esto se abrir un cuadro de dilogo con todos los archivos guardados, de donde debers elegir el archivo con el cual trabajaras, una vez seleccionado presiona el botn Abrir para visualizar los datos en SPSS, recuerda que los archivos en SPSS son guardados con la extensin SAV, y podras pensar que por tal efecto slo podrs trabajar en SPSS con archivos que contengan la extensin SAV, pero no es as, en SPSS puedes utilizar archivos con diferentes tipos de extensin. SPSS puede leer archivos editados por cualquier otro programa de uso estadstico o de base de datos, por nombrar algunos son: Excel (uno de los ms comunes), Access, Visual FoxPro, entre otros. 2.4.1 LEER DATOS DE WORD PARA WINDOWS En SPSS tambin podemos hacer uso de los archivos denominados planos, es decir de aquellos que provienen de un editor de texto, en este caso veremos como es que podemos hacer uso de datos que estn capturados en archivos con extensin DOC, como es seguro todos ustedes sabrn que se trata del editor de texto de Microsoft Word para Windows y hay dos alternativas. La primera consiste en guardar los datos como texto (ASCII) y emplear el lenguaje de comandos del SPSS (que no se ver en este manual) o el asistente de lectura de archivos de texto (Elija Archivo Leer datos de texto). La segunda, que se explica a continuacin, permite leer, fcilmente, los datos empleando el portapapeles. Al capturar los datos en el programa Word los datos de cada sujeto (caso) tienen que estar en una sola lnea (si el tamao de la pgina no lo permite, se puede emplear un tamao de pgina personalizada con pginas ms anchas o bien definir la posicin de los tabuladores de forma que stos estn ms prximos entre s). Los datos de cada sujeto se introducen separndolos con tabulaciones, es decir, se inserta un dato, se pulsa el tabulador, se inserta otro dato, se pulsa el tabulador, y as sucesivamente. Un dato perdido se inserta con dos tabuladores. Para decimales hay que emplear el punto. Una vez capturados todos los datos en Word y situados en este programa: 1) Seleccionar todo o utilizar la combinacin de teclas para este fin Ctrl. + E. 2) Copiar lo seleccionado Edicin Copiar o combinacin de teclas Ctrl. + C y se copiaran todos los datos en el portapapeles. 3) Una vez copiados los datos debers abrir el programa SPSS, o cambiarse a l si ya esta abierto. 4) En SPSS en el Editor de datos posicinate en la casilla 1 de la primera variable y elige Edicin Pegar o la combinacin de teclas Ctrl. + V.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Editor de texto Word. Datos pegados de Word a SPSS
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 2.4.2 LEER DATOS EN FORMATO ASCII (TEXTO) Otro modo de leer datos externos es a partir del tan conocido formato ASCII, hay que elegir Archivo Leer datos de texto. Selecciona el archivo que quieres leer. SPSS entiende por defecto que este archivo debe tener una extensin TXT o DAT, si tu archivo tiene otra extensin escribe el nombre completo del archivo si lo conoces o elige en la seccin Tipo de archivos la opcin Todos los archivos y seleccinalo de la lista. A partir de ah un asistente te ira guiando en el proceso e incluso te mostrar las primeras lneas del archivo de texto. Los datos en el Bloc de notas fueron capturados de la misma forma en la que fueron capturados los datos en Word.
Al abrir datos con una extensin TXT o DAT desde SPSS aparecern una serie de cuadros de dilogo en los que debers elegir ciertas opciones, en este caso solo describir aquellos pasos que nos servirn para utilizar el archivo Ejemplo.txt previamente creado y guardado: 1) En SPSS elige el botn Archivo Leer datos de texto. 2) En el cuadro de dilogo Abrir archivo selecciona el archivo Ejemplo, no ser necesario que determines el tipo de extensin, pues automticamente SPSS sobre entiende eso, una vez seleccionado pulsa sobre el botn Abrir. 3) En el siguiente cuadro de dilogo paso 1 de 6 debers presionar el botn Siguiente. 4) En el cuadro de dilogo paso 2 de 6, de forma automtica estn seleccionados los comandos que nos dicen que nuestros datos estn delimitados por tabulaciones o una coma, en este caso nuestros datos estn delimitados por tabulaciones, deberemos seleccionar esa opcin. En el segundo apartado del mismo cuadro de dilogo nos preguntan si nuestro archivo contiene encabezados que son los nombres de las variables, en este caso nuestros datos no contienen encabezados, entonces seleccionamos la opcin no, en caso contrario seleccionar si, una vez hecho esto presiona sobre el botn Siguiente. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 5) En el cuadro de dilogo paso 3 de 6, el primer apartado nos pregunta que a partir de que lnea inician los datos, en nuestro archivo Ejemplo inician desde la lnea 1, deberemos elegir el nmero 1, en el segundo apartado se nos hace la pregunta de cuantos casos queremos que sean representados, deberemos elegir todos los casos que es la primera opcin o definir un nmero determinado de columnas para la otra opcin, en nuestro caso podemos seleccionar la primera opcin o la segunda, siempre y cuando determinemos que son 4 variables, en caso contrario si decimos que son menos variables, por ejemplo 3 al final tendramos un caos en nuestros datos, en el tercer apartado de este cuadro de dilogo se nos hace la pregunta cuantos datos son con los que deseamos trabajar, como deseamos trabajar con todos los datos seleccionamos Todos los casos, despus presiona sobre el botn Siguiente. 6) En el cuadro de dilogo paso 4 de 6 es solo para confirmar que cada uno de los datos esta separado con tabulaciones, presiona en el botn Siguiente. 7) En el cuadro de dilogo paso 5 de 6, debers agregar los nombres de cada una de las variables de las que hars uso en tu archivo, como recordaras en el paso 2 de 6 le dijimos a nuestro cuadro de dilogo que nuestros datos no contenan encabezados, por lo tanto en este cuadro de dilogo SPSS nos permitir nombrar las variables, para agregar un nombre debers seleccionar cada una de las variables y nombrarlas, una vez nombradas todas tus variables presiona el botn Siguiente.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 8) En el cuadro de dilogo paso 6 de 6 ya solo debers presionar el botn Finalizar, para visualizar los datos en el Editor de datos de SPSS.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
En ocasiones, los datos de un archivo sern de tal ndole que ser posible aplicar directamente sobre ellos el anlisis estadstico deseado. Pero esto slo ocurrir en una situacin ideal; y las situaciones ideales raramente se presentan. Ms bien al contrario, lo habitual ser encontrarse con archivos de datos que necesitarn ser cuidadosamente preparados antes de poder aplicar con las mnimas garantas cualquier anlisis estadstico. La preparacin del archivo de datos incluye desde la simple deteccin y correccin de los posibles errores cometidos al introducir datos, hasta sofisticadas transformaciones (necesarias a veces para llegar a obtener las variables que realmente interesan), pasando por la remodificacin de los cdigos utilizados para los valores de una o ms variables, o la creacin de nuevas variables a partir de otras ya existentes. El men Transformar de la barra de mens principal incluye una serie de opciones que permiten efectuar diferentes tipos de transformaciones, desde las ms simples a las ms complejas. 3.1 CREACIN DE VARIABLES (COMPUTE) Si se elige Transformar Calcular, podremos crear nuevas variables a partir de otras o transformar las ya existentes, haciendo uso de operadores aritmticos, operadores lgicos, funciones aritmticas, funciones estadsticas, funciones lgicas y otras1. - Los operadores aritmticos son: + (suma), - (resta), * (multiplicacin), / (divisin) y ** (elevar a una potencia). - Los operadores lgicos son: > (mayor que), < (menor que), >= (mayor o igual que), <= (menor o igual que), = (diferente que), = (igual que), AND (y), OR (o) y NOT (no), estos operadores lgicos son usados en el momento que queramos que una operacin de cualquier tipo cumpla con ciertas condiciones, haciendo uso del botn SI (IF). - Las funciones aritmticas son: ABS (valor absoluto), RND (redondeo), TRUNC (truncado), SQRT (raz cuadrada), EXP (elevar e a un nmero), LN (logaritmo natural), LG10 (logaritmo en base 10), SIN (seno), COS (coseno), ATAN (arco tangente), MOD10 (modulo10). - Las funciones estadsticas son: SUM (suma), MEAN (media), SD (desviacin estandar), VAR (varianza), CFVAR (coeficiente de variacin), MIN (mnimo), MAX (mximo). - Las funciones lgicas son: RANGE (valor de variable en intervalo), ANY (valor en una variable igual a valor en otras variables o valores).
1 P a r a v e r t o d a s s u s p o s i b i l i d a d e s e l i j a d e l m e n ? T e m a s , e n l a s o l a p a B s q u e d a , e s c r i b a C o m p u t e , p u l s e E n t e r y h a g a d o b l e c l i c s o b r e e l t e m a C o m p u t e C o m m a n d S y s t a x . Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 3.1.1 Creacin de nuestra primera variable Supngase que deseamos tener una nueva variable que sea el resultado de dividir la variable peso (en kilos) por la variable altura (en metros) elevada al cuadrado (peso/altura) y a la que se va a llamar ndice. Entonces elegimos Transformar Calcular. PESO: 64. 80, 70, 55, 69, 120, 40, 89, 100. ALTURA: 1.50, 1.82, 1.70, 1.40, 1.20, 1.65, 1.00, 1.70, 1.50.
Se muestra a continuacin el cuadro central con indicacin del significado de algunas de sus teclas. Si se pulsa el botn derecho del ratn sobre un botn o sobre una funcin, ofrece informacin acerca de l.
Para usar las funciones seleccionar y pulsar el botn Creacin condicional mayor o igual que AND D NOT distinto a OR Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n En el cuadro de dilogo Calcular variable, escribe la palabra ndice en la casilla Variable de destino que ser el nombre de la nueva variable. En la casilla Expresin numrica se construye la operacin que definir la nueva variable. Veamos como se realiza la definicin de la variable empleando los elementos del cuadro de dilogo. Para utilizar (elegir) un elemento hacer clic sobre l. 1) Seleccionar la variable PESO y hacer clic en el botn . 2) Elegir el signo /. 3) Elegir el signo ( ). 4) Seleccionar la variable ALTURA y hacer clic en el botn . 5) Elegir el signo **. 6) Elegir el nmero 2. 7) Elegir el botn aceptar. Se puede aadir una etiqueta a la variable creada con el botn Tipo y etiqueta. 3.1.2 Creacin de una variable condicional Por otro lado si solo quisiramos visualizar el ndice nicamente de los casos que cumplan con la condicin de 80 kilos o ms para la variable PESO, tenemos que hacer uso del botn de condicin que es el que nos facilitara la creacin condicional de variables.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Elija el botn en el cuadro de dilogo que surge al elegir Transformar Calcular. Crea nuevas variables o da nuevos valores a variables existentes si una determinada expresin lgica es cierta. Si no se cumple la condicin, no se realizar ninguna operacin y el caso tendr un valor perdido si la variable es nueva, o el valor original si la variable ya exista. En este ejemplo se quiere hallar la variable ndice que tiene la frmula (peso/altura) pero slo para aquellos casos que pesan ms de 80 kilos. El proceso es: 1) Elige Transformar Calcular. 2) Escribir el nombre de la nueva variable. 3) Escribir la expresin: (peso/altura). 4) Hacer clic en el botn y aparece el cuadro Calcular variable: Si los casos. 5) En este cuadro marcar el crculo al lado de Incluir si el caso satisface la condicin. 6) Escribir en la casilla la expresin peso >= 80 directamente o ayudndose de los botones del cuadro dilogo. 7) Pulsar el botn continuar. 8) Pulsar el botn aceptar. Si la variable ndice es nueva, la expresin slo se calcular para aquellos casos con peso de 80 a ms kilos. En los restantes casos tendrn valor perdido. Si la variable ndice ya exista, se calcular la expresin para los casos con 80 o ms kilos; para el resto la variable ndice tendr el valor que tenia antes de hacer la transformacin. 3.2 RECODIFICACIN DE VARIABLES (RECODE)
La opcin Recodificar del men Transformar permite cambiar los valores de una variable. La recodificacin resulta especialmente til para agrupar en un nico valor diferentes valores de una variable, y para transformar variables con formato de cadena en variables con formato numrico. Existen dos posibilidades: En distintas variables recodifica la variable y crea una variable nueva con esta remodificacin; y la opcin En las mismas variables recodifica la variable, es decir, los datos originales de la variable se sustituyen por los nuevos 2 .
2 A l s u s t i t u i r v a l o r e s e x i s t e n t e s d e u n a v a r i a b l e p o r v a l o r e s r e c o d i f i c a d o s , e s t o s d e s a p a r e c e r n d e f i n i t i v a m e n t e d e l a b a s e d e d a t o s , p o r l o c u a l n o p o d r n s e r u t i l i z a d o s n u e v a m e n t e e n f u t u r o s a n l i s i s , a m e n o s q u e s e h a g a u n r e s p a l d o d e l a r c h i v o o r i g i n a l . Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 3.2.1 Ejemplo de recodificacin. Supngase que tenemos una variable que se llama CONTINENTE y se desea reducir las alternativas EUROPA, ASIA y AFRICA a una sola y crear una nueva variable con esta recodificacin. Para ello se elige Transformar Recodificar En distintas variables. Aparece el cuadro de dilogo Recodificar en distintas variables. Se selecciona de la ventana con la lista de variables la variable CONTINENTE y se pulsa el botn , la variable aparecer as en la ventana central: CONTINENTE ?. Escribe el nuevo nombre: NCONTINENTE en la casilla Nombre: de la seccin Variable de resultado (opcionalmente puedes agregar una etiqueta para la nueva variable en la casilla Etiqueta) y pulsa el botn cambiar. En la ventana central quedar as: CONTINENTE NCONTINENTE. CONTINENTE: 1, 2, 3, 4, 5. NCONTINENTE: 1, 2, 2, 2, 3. (nueva variable recodificada)
Una vez definido el nuevo nombre se hace clic en el botn Valores antiguos y nuevos para acceder al cuadro de dilogo de la figura siguiente. 3.3 RECODIFICACIN AUTOMATICA (AUTORECODE) Al igual que la herramienta recode el uso de la recodificacin automtica nos permitir modificar los datos de una variable, pero esta herramienta como su nombre lo dice transformara dichos datos de manera automtica y correlativamente. Por ejemplo, si una variable tiene los valores 1, 2, 4 , 7 y 9, al recodificarla automticamente tendr los valores 1, 2, 3, 4 y 5, y en la plantilla se agregara una nueva variable con los nuevos valores recodificados. El proceso para recodificar es:
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 1) Elige Transformar Recodificacin automtica. 2) Del cuadro de dilogo selecciona y transfiere la variable (recuerda el tema 1.2) que desees recodificar. 3) Vers que existe una cuadro de texto Nuevo nombre en el que se te pedir agregar un nombre para la nueva variable recodificada. 4) Una vez escrito el nuevo nombre presiona el botn Agregar nuevo nombre. 5) Si lo deseas podrs determinar el sentido de la nueva recodificacin, es decir podrs recodificar los valores de la variable de forma ascendente o descendente. 6) Finalmente elige el botn Aceptar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
En la figura siguiente veremos los valores de la variable VAR01 autorecodificados de forma ascendente y descendente respectivamente en las nuevas variables NVAR01 y NNVAR01. 3.4 CATEGORIZADOR VISUAL Esta herramienta nos permitir recodificar una variable continua en valores cualitativos o categricos 3 de forma grfica, es decir, podremos visualizar la distribucin de los datos antes de realizar la recodificacin y que admite varias posibilidades ms. Como ejemplo se va a recodificar la variable S3_Edad del archivo Banco, y deber quedar de la siguiente manera:
Edad Del menor a 30 De 30 a 40 De 40 a 50 De 50 al mayor N_Edad 1 2 3 4
3 L o s v a l o r e s c a t e g r i c o s t a m b i n s e r n d e n o m i n a d o s v a l o r e s c u a l i t a t i v o s ( v e r t e m a 2 . 1 . 1 ) Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Para hacer uso de esta herramienta elige Transformar Categorizador visual y del cuadro de dilogo elige y transfiere la variable que transformaremos a Categorizar variables, en este momento podemos decidir si deseamos trabajar con el total de datos de la variable o si slo deseamos trabajar con un nmero limitado de valores, por ejemplo si solo deseas trabajar con n nmero de valores, debers activar el apartado Limitar a un nmero de casos y agregar el nmero de casos que deseas transformar y pulsa el botn continuar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n En el siguiente cuadro de dilogo debers seleccionar la variable S3_Edad y entonces inmediatamente aparecer la distribucin de la variable.
Como veras en este cuadro de dilogo existe una tabla de dos columnas encabezadas con la palabra Valor y Etiqueta. En la columna Valores debers agregar los puntos de corte: 30, 40, 50 y SUPERIOR. Se escribe el nombre de la nueva variable en Variable categorizada, si lo deseas en la columna Etiqueta puedes agregar las etiquetas de los valores, finalmente pulsa el botn aceptar. Una vez presionado el botn aceptar, visualizaras a la nueva variable recodificada por este mtodo al final de tu plantilla de datos llamada S3_Nedad. 3.5 ASIGNAR RANGOS A CASOS (RANK) Esta herramienta nos servir para crear nuevas variables que contengan rangos, es decir, transformara una variable que contenga valores numricos no consecutivos en una nueva variable con valores consecutivos y ordenados de 1 a n. En SPSS podremos encontrar varios mtodos para llevar acabo esta sustitucin, rango, puntuacin de savage, rango fraccional, rango fraccional por porcentaje, suma de ponderacin de casos, percentiles y puntuaciones normales, de los cuales solo estudiaremos el mtodo de Rango. El proceso para asignar rangos a casos es: 1) Alije Transformar Asignar rangos a casos. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 2) Selecciona la variable y agrgala al apartado Variable(s). 3) Finalmente presiona el botn Aceptar, y la nueva variable se aadir al Editor de datos como ltima variable.
Hay dos formas de asignar rangos a los valores de una variable, esta la podrs determinar en el cuadro de dilogo Rango de casos y se encuentra en el apartado Rango Asignado 1 a... 1) valor ms pequeo, es decir el nmero 1 ser asignado al valor ms pequeo de la variable, el 2 para el siguiente, y as sucesivamente; 2) valor ms grande, es decir el nmero 1 ser asignado al valor ms grande de la variable, el 2 al siguiente ms grande, y as sucesivamente. Pero, que pasa con los valores de una variable que se repiten. Por defecto SPSS asigna la media de los rangos a cada uno de los casos. Si pulsas en el botn Empates podrs seleccionar otras posibilidades de asignar rangos. Se puede asignar el rango menor a todos los valores iguales o el rango mayor. La ltima posibilidad es que haya tantos rangos como valores distintos en la variable y esto se logra marcando al lado de Rangos secuenciales para valores nicos.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 3.5.1 Rangos por grupos Esta forma de asignar rangos a variables es bastante til, pues se pueden realizar transformaciones por separado para grupos definidos por otra variable (usualmente cualitativa). Por ejemplo del archivo Banco existe una variable S3_Edad (edades) y una variable S7_Cd (ciudades), entonces podemos transformar la variable S7_Edad en rangos por separado para la Ciudad de Mxico, Monterrey y Guadalajara. En el cuadro de dilogo principal Asignar rangos a los casos selecciona la variable S7_Cd y transferirla a la ventana titulada Por.
3.6 CONTAR CASOS (COUNT) Esta herramienta es utilizada para crear una variable donde visualizaremos el nmero de veces que aparecen determinados valores en otras variables. A modo de ejemplo haciendo uso de la variable S7_Cd que corresponde a una encuesta realizada por un Banco, donde los encuestados fueron de tres ciudades diferentes y que al codificarla, a la ciudad de Mxico le corresponde el nmero 1, a la ciudad de Monterrey el 2 y a la ciudad de Guadalajara el 3 y deseamos crear una nueva variable donde solo se contabilice a los encuestados que les corresponda el nmero 3, es decir a los encuestados de la ciudad de Guadalajara. El proceso para contar casos es: 1) Elige el botn de men Transformar Contar apariciones. 2) En el cuadro de dilogo en la casilla Variable de destino escribe el nombre de la nueva variable que contendr los conteos. 3) Selecciona y transfiere la variable al apartado Variables numricas. En este apartado podrs transferir ms de una variable si as lo deseas. 4) Veras que existe la opcin de agregar una etiqueta a la nueva variable, esto lo podrs hacer en la casilla Etiqueta del destino. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 5) Pulsa el botn Definir valores... 6) En el cuadro de dilogo siguiente escribe el valor 3 en la casilla al lado de Valor. 7) Pulsa el botn Aadir. El valor 3 aparecer en la ventana de Contar los valores. 8) Pulsar el botn Continuar. 9) Finalmente pulsa el botn Aceptar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 3.7 VALORES PRDIDOS (MISSING) Hasta ahora hemos estado hablando de valores con los que podemos realizar alguna transformacin o tratamiento dentro de nuestro programa de SPSS, pero SPSS no se limita nicamente a valores existentes como valores numricos o de texto, si no que tambin tiene el poder de reconocer casos de variables en los que se ha omitido algn valor o aquellos valores a los que nosotros deseamos que sean contabilizados como valores perdidos, es decir que no tengan ningn efecto entre los datos de los cuales se llevaran acabo anlisis de cualquier ndole. SPSS determina dos tipos de valores perdidos, los primeros son determinados por el sistema que son aquellos que en casos de variables se omiti la insercin de datos, en pocas palabras los valores perdidos determinados por el sistema son celdas que no contienen valores y son determinados automticamente; los segundos son aquellos generados por el usuario atribuyendo de forma manual a casos de variables un valor determinado. Para que SPSS determine cual o cuales son los valores que reconocer como perdidos por el usuario es necesario tratarlos con atributos (ver tema 2.1.2) a partir de la Vista de variables. 3.7.1 Valores perdidos determinados por el usuario Como ya sabemos, los valores perdidos determinados por el usuario son aquellos que de antemano fueron establecidos a partir del atributo Perdidos que encontramos en la Vista de variables y podemos determinar de dos maneras los valores perdidos, de forma discreta o por rangos ms un valor discreto si fuera necesario. Y lo podemos realizar de la siguiente manera: - En la Vista de variables en la columna Perdidos pulsa sobre este botn . Aparecer el cuadro de dilogo Valores perdidos.
- En este cuadro de dilogo por defecto solo se reconocern valores perdidos por ausencia de datos en celdas que sern los determinados por el sistema, pero como te habrs dado cuenta existen dos alternativas ms que sern las que le permitan al usuario determinar valores existentes en las variables como valores perdidos.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 1) Si seleccionamos Valores discretos perdidos podremos determinar hasta 3 valores perdidos, estos valores pueden ser continuos o discontinuos. 2) Si seleccionamos Rango de valores perdidos podremos determinar todo un rango de valores sin restriccin y adems opcionalmente podemos agregar un valor que no este contenido dentro del rango definido. Cuando llevamos acabo cualquier anlisis de una o ms variables que contengan valores perdidos, estos no se incluyen en dichos anlisis y solo se nos comunicara que existe un nmero determinado de valores perdidos.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Los temas siguientes que corresponden a este captulo son de gran ayuda pues ahora no solo analizaremos muestras completas si no que aprenderemos a realizar anlisis de datos para grupos por separado o si lo deseamos solo con una parte de los casos. Estas herramientas no solo las podremos activar desde el botn de men correspondiente, tambin podremos activarlas desde la barra de herramientas, pues estas tambin las hallaremos ah. En el captulo anterior al realizar una transformacin en una variable, esa transformacin la podamos visualizar en el Editor de datos sobre la misma variable o en una variable nueva, esto no suceder en la mayora de los temas de este captulo; por ejemplo, en el momento en el que hagamos uso de la herramienta Separacin de casos no veremos ninguna diferencia en el Editor de datos, ni tampoco visualizaremos una variable nueva, en este caso la utilidad de esta herramienta solo la visualizaremos generalmente en el momento en el que realicemos un anlisis estadstico, pues veremos que ese anlisis se realizo de forma grupal y ser visualizado en la ventana de resultados. 4.1 SEPARACIN DE CASOS (SPLIT FILE) Esta herramienta nos ayudara a organizar los datos de una variable generalmente cualitativa por grupos, al hacer uso de esta herramienta sobre cualquier variable, todas las dems variables del archivo se vern influidas por aquella que nos sirvi de base para crear grupos, esto quiere decir que si por ejemplo deseamos tratar una variable llamada genero con esta herramienta, y posteriormente deseamos calcular la frecuencia de la variable ciudad, los resultados los veremos divididos por genero, lo que no ocurrira si no hubisemos separado la variable genero. Veamos un ejemplo. Para esta demostracin haremos uso del archivo Banco.sav. Por ejemplo, si deseamos hallar la frecuencia de la variable S7_Cd (ciudades) separada por hombres y mujeres debers elegir Datos Segmentar archivo, o tambin puedes hacer clic sobre el siguiente icono . En el cuadro de dilogo marca el botn de seleccin al lado de Comparar los grupos, selecciona la variable a separar y transfirela en este caso la variable ser S6_Gen, y finalmente presiona el botn Aceptar. En apariencia no podremos determinar si a sucedido algo, pero si observas en la ltima casilla de la barra de estado podrs darte cuenta que hay algo nuevo, una palabra que nos dir de que manera se encuentra nuestro archivo, y veremos la palabra Segmentado. Despus elige Analizar Estadsticos descriptivos Frecuencias, selecciona la variable S7_Cd y transfirela y presiona el botn Aceptar. En el visor de resultados visualizaras la frecuencia de cada una de las ciudades pero separadas por hombres y mujeres.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Como te podrs dar cuenta, adems de la frase Comparar los grupos esta Organizar los resultados por grupos, ambas agruparan la variable seleccionada, y tambin se realizar el anlisis por separado para hombres y mujeres, la diferencia radica en el visor de resultados, pues mientras que seleccionemos Comparar los grupos, los resultados del anlisis lo visualizaremos en una sola tabla, si seleccionamos Organizar los resultados por grupos, los resultados se presentaran de una forma menos integrada en el visor de resultados, es decir los resultados los visualizaremos en tablas separadas. En el momento en el que se decida separar un archivo cada vez que deseemos realizar un anlisis con cualquiera de las dems variables , este se realizara por separado para hombres y mujeres. En caso de que ya no deseemos que los anlisis se realicen por separado deberemos deshacer la agrupacin, y esto se logra accediendo al cuadro de dilogo Segmentar archivo y marcar el botn de seleccin de la frase Analizar todos los casos, no crear los grupos, y hacer clic sobre el botn Aceptar. Y veremos que la frase Segmentar de la barra de estado desaparece. 4.2 FILTRADO DE CASOS (SELECT CASE) Para aquellos que tengan la experiencia de trabajar en una hoja de clculo de Excel, les ser familiar la palabra filtrado, y si, el filtrado que se realiza en una hoja de clculo de Excel es muy similar al filtrado de casos que se realiza en SPSS, entonces ya te estars dando una idea de lo que veremos a continuacin. Pues bueno, esta herramienta nos ayudara a determinar que parte de los sujetos de las variables sern analizados, al contrario que en Excel, los datos filtrados en SPSS los seguiremos visualizando en el Editor de datos, con la diferencia de que los datos que no sern usados en los anlisis estarn con una diagonal en la parte que nos muestra el numero de casos de cada una de las variables. Para realizar el filtrado de una parte de los sujetos hay que elegir el botn de men Datos Seleccionar casos o tambin puedes hacer clic sobre el siguiente icono . En el siguiente cuadro de dilogo debers elegir la opcin que satisfaga la manera en la que desees realizar tu anlisis. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n A continuacin explicare cada una de las opciones que nos ofrece este cuadro de dilogo para poder realizar los diferentes filtrados.
3) Todos los casos: Esta frase esta seleccionada por defecto, pues cada vez que nosotros realizamos un anlisis de cualquier ndole lo hacemos con todos los datos sin restriccin alguna, en el momento que seleccionemos cualquier otra opcin de este cuadro de dilogo, ya no estaremos trabajando con todos los datos, por ende en el momento en el que no necesitemos ms el filtrado y deseemos seguir trabajando con todos los datos deberemos abrir de nueva cuenta el cuadro de dilogo Seleccionar casos y activar el botn de seleccin de la frase Todos los casos. 4) Si se satisface la condicin: Para activar esta forma de filtrado debers pulsar sobre el botn Si.... Y acceders aun nuevo cuadro de dilogo, en el cual tendrs las herramientas para decidir que datos sern filtrados dependiendo de si cumplen o no una condicin que tu estars determinando. 5) Muestra aleatoria de casos: En esta forma de filtrar, como su nombre lo indica podremos determinar de manera aleatoria un determinado porcentaje de datos para su anlisis o seleccionar una muestra de sujetos de los primeros n casos. 6) Basndose en el rango del tiempo o de los casos: Esta forma de filtrar casos, funciona por rangos, por ejemplo podemos solo seleccionar del sujeto 20 al 54. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 7) Usar variable de filtro: Podremos usar cualquier variable para la seleccin de casos, solo debemos seleccionar la variable y transferirla, este filtrado funciona seleccionando los casos cuyo valor sea distinto de cero o no sea valor perdido. Para finalizar con el tema de filtrado debo darte algunas recomendaciones, en el momento en el que decidas hacer uso de esta herramienta, debers tomar tus precauciones, como te habrs dado cuenta cada vez que activabas el cuadro de dilogo Seleccionar casos por defecto la frase Filtrado estaba seleccionada, que quiere decir esto , bueno, cada vez que realizas un filtrado con esta opcin activada, tienes la oportunidad de deshacer ese filtrado y trabajar de nuevo con todos los datos originales de tu archivo, si por algn motivo seleccionas la frase Eliminados y realizas un filtrado, los datos que sern ignorados para los anlisis se eliminaran definitivamente del archivo original, por lo que no tendrs la oportunidad de revertir el filtrado en determinado momento en el que necesites trabajar con todos los datos del archivo, para evitar esto te recomiendo guardar el archivo filtrado con un nombre diferente. 4.3 PONDERAR CASOS (WEIGHT CASES) La palabra ponderar significa dar un peso especifico a una serie de valores a partir de otra serie de valores, es decir, que un caso de una variable especifica represente a otros casos de variables diferentes. Como ejemplo tomaremos el clsico juego del dado, supongamos que lanzamos 20 veces el dado y contabilizamos las veces, en que sali una de sus caras, esto lo vemos en la siguiente tabla:
Caras 1 2 3 4 5 6 # de veces 2 3 5 3 2 5
Si deseas interpretar esta tabla, seguramente estars pensando que la cara del dado con el valor 1 se repiti 2 veces, que la cara del dado con el valor 2 se repiti 3 veces y as hasta llegar a la cara del dado con el numero 6 que se repiti 5 veces, lo que acabamos de realizar con esta interpretacin fue haber ponderado la variable Caras a partir de la variable # de veces, por lo tanto la variable que usamos para ponderar otra variable fue la variable # de veces. Veamos como lo podemos hacer en SPSS. Para realizar la ponderacin en SPSS debers elegir de la barra de mens Datos Ponderar casos, o tambin puedes hacer clic sobre el siguiente icono . En el siguiente cuadro de dilogo debers seleccionar la opcin Ponderar casos por y seleccionar la variable que ponderara a las dems, que en este caso la variable ser Veces y transferirla, finalmente presionar el botn Aceptar. Posteriormente puedes realizar algn anlisis, por ejemplo visualizar la frecuencia de la variable Caras, que ser en este momento en el que veras la utilidad de ponderar casos.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Al utilizar la herramienta de ponderacin, esta permanecer cada vez que realices algn tipo de anlisis, podrs revertir el uso de ponderacin, si activas de nuevo el cuadro de dilogo Ponderar casos y seleccionar la opcin No ponderar casos y presionar el botn Aceptar.
4.4 ORDENAR CASOS (SORT) Con esta herramienta podremos ordenar los casos de forma ascendente o descendente en funcin de una o ms variables. Y se hace de la siguiente manera, elige de la barra de mens Datos Ordenar casos, en el cuadro de dilogo selecciona la o las variables que servirn para ordenar los datos, posteriormente debers decidir en que orden estarn ordenados ya sea de forma ascendente o descendente.
Si despus de realizar una ordenacin se guardan los datos, se mantendr la ordenacin.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
La Estadstica puede dar respuesta a muchas de las necesidades que la sociedad actual nos plantea. Su tarea fundamental es la reduccin de datos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla. Hasta ahora solo hemos manipulado los datos, ya sea en transformaciones para obtener nuevos o sustituirlos por otros y tambin hemos aprendido a reagrupar esos datos para futuros anlisis. A partir de este captulo conoceremos herramientas que nos ayudarn a obtener resultados estadsticos para futuras interpretaciones. Para ello se supondr que el estudiante de SPSS ya comprende los conceptos bsicos estadsticos, puesto que es esencial para el mejor manejo de nuestro programa y la mejor comprensin de los temas subsecuentes. Empezaremos diciendo que la estadstica tiene como finalidad estudiar detalladamente las caractersticas de un conjunto de datos, este conjunto de datos puede ser toda una poblacin o una parte de esta a la que comnmente se le llama muestra poblacional. Este estudio se realiza a travs de las variables (cuantitativas o cualitativas), que son cantidades que pueden tomar distintos valores de un momento a otro o de un objeto a otro, y son propiedades de los casos que pueden tomar distintos valores, por ejemplo si tuvisemos una poblacin determinada y el objeto de estudio es el gnero, entonces el gnero es una variable porque puede tomar distintos valores: hombre o mujer. Ahora bien, pasando al uso de nuestro programa SPSS, este nos ayudara precisamente a estudiar las caractersticas de nuestros diferentes datos, como pueden ser la frecuencia, la tendencia, la dispersin y la distribucin de los datos. A lo largo de los prximos temas, aprenderemos a utilizar las herramientas que nos ayudaran a generar la estadstica ms bsica hasta la que no lo es tanto. Aprenderemos a generar desde una simple tabla de frecuencias hasta el poder generar relaciones complejas entre ms de una variable. Y no solo obtendremos resultados, si no que en los ejemplos que se vean en este manual se intentara dar una interpretacin para el buen entendimiento de los resultados. Tambin aconsejaremos al estudiante de SPSS a decidir que tipos de herramientas y estadsticos se podrn usar para determinados tipos de datos, esto con la finalidad de obtener las mejores interpretaciones. Empecemos pues, a introducirnos al mundo del anlisis estadstico que nos ofrece el programa de SPSS.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
La estadstica se divide en otras ramas, una de esas ramas es la estadstica descriptiva que se dedica a analizar y representar los datos de la forma ms bsica pero es fundamental en todo estudio. La estadstica descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. La estadstica descriptiva nos servir para estudiar algunas de las caracterstica de las variables, de las cuales estudiaremos las siguientes: 8) La distribucin de frecuencias. 9) Medidas de posicin central, es decir, la media, mediana y moda. 10) Medidas de posicin no central, como los cuartiles, deciles y percentiles. 11) Medidas de dispersin, como son el rango, varianza y desviacin estndar. 12) Medidas de forma: grado de concentracin, coeficiente de asimetra y coeficiente de curtosis.
6.1 DESCRIPCIN DE VARIABLES (FREQUENCIES) La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Cuando se describe una variable se trata de reducir un conjunto de nmeros a unos ndices numricos que representen adecuadamente a ese conjunto de nmeros. Los ndices suponen una descripcin reduccionista porque reducen un conjunto de nmeros a unos pocos, que nos ayudarn a medir las principales caractersticas de las variables en estudio. En SPSS la forma de activar la herramienta que nos permitir estudiar la frecuencia es de la siguiente manera, elige de la barra de mens Analizar Estadsticos descriptivos Frecuencias, y en el cuadro de dilogo que aparece selecciona y transfiera la o las variables que desees analizar, despus presiona el botn Aceptar. Como recordaras en el tema 2.1.1 hicimos alusin a diferentes tipos de variables, las nominales, ordinales y de intervalo, entonces para cada uno de estos tipos de variables veremos que tipo de descripcin podemos realizar para cada una de estas variables, para su mejor comprensin y estudio. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 6.1.1 Descripcin de variables nominales Para la mejor comprensin del anlisis de las variables nominales, estas se estudian mediante la distribucin de frecuencias, la grfica de barras o la grfica de sectores y un estadstico descriptivo que en este caso ser la moda. Del archivo Banco.sav, las variables nominales son el gnero y la ciudad, entonces a partir de estas veremos el siguiente ejemplo. Empezaremos por describir a la variable regin, entonces elige Analizar Estadsticos descriptivos frecuencias, y selecciona la variable regin y transfirela.
Si en este momento decides presionar el botn Aceptar del cuadro de dilogo Frecuencias se generara un visor de resultados, en donde apreciaremos la frecuencia de cada uno de los valores que componen la variable ciudad, pero no es lo nico que necesitamos, aun hace falta el grfico y el estadstico descriptivo, para generarlos presiona el botn Grficos del cuadro de dilogo y en el nuevo cuadro de dilogo selecciona la opcin Grficos de barras, al activar este tipo de grfico se activaran dos alternativas ms y es respecto al modo en el que desees visualizar los datos, si por frecuencias o porcentajes y haz clic en el botn Continuar. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Hasta ahora ya tenemos las frecuencias de la variable y la grfica de esta, pero aun nos hace falta dar la orden de que SPSS genere el estadstico descriptivo, y lo hacemos de la siguiente manera, aun en el cuadro de dilogo Frecuencias presiona el botn Estadsticos, en el nuevo cuadro de dilogo en la seccin tendencia central selecciona el estadstico Moda y presiona el botn continuar. Por ltimo presiona el botn Aceptar del cuadro de dilogo principal.
Una vez presionado el botn Aceptar del cuadro de dilogo Frecuencias, inmediatamente saldr de la nada una nueva ventana, a esta nueva ventana le llamaremos Visor de resultados, que como su nombre lo dice es donde podremos visualizar todos aquellos anlisis que realicemos con nuestros datos, en este caso visualizaremos la tabla de frecuencias, el estadstico descriptivo y el grfico que solicitamos. CIUDAD Frequency Percent Valid Percent Cumulative Percent Valid Mxico D.F 24 82.8 82.8 82.8 Guadalajara 2 6.9 6.9 89.7 Monterrey 2 6.9 6.9 96.6 999 1 3.4 3.4 100.0 Total 29 100.0 100.0
Como podrs ver, la tabla que nos arroja los resultados de la frecuencia de los casos de la variable ciudad esta dividida en 4 columnas, y a continuacin veremos que significan cada una de estas columnas: - En la columna Frecuencia, vemos el nmero de casos que se repiten de un valor, y vemos que el valor que ms se repite es el que corresponde a Mxico D. F. Y nos dice que de los 29 encuestados 24 son de esta ciudad, y as para cada uno de los valores. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n - La columna Porcentaje nos sirve para visualizar el porcentaje que corresponde a la repeticin de un valor del total, es decir, decimos que del 100% de los encuestados solo el 6.9% correspondan a la ciudad de Monterrey. - La columna Porcentaje valido, sirve para mostrar los porcentajes de las repeticiones sin tomar en cuenta los valores perdidos, en este caso los valores de esta columna son idnticos a la columna Porcentaje, puesto que no hay valores perdidos. Si hubiese valores perdidos, el porcentaje de las repeticiones seguramente aumentara con respecto al total de valores validos. - La columna Porcentaje acumulado va sumando la frecuencia de cada valor con las frecuencias de los valores menores a l, de los Porcentajes validos. Con respecto al grfico que solicitamos a SPSS, que en este caso fue un grfico de barras, como seguramente ya lo sabes cada barra nos describe cada una de las frecuencias de los casos de una variable. Si deseas cambiar el aspecto de la grfica o aadir elementos, habr que editarla. Para editar una grfica da doble clic continuo sobre ella. Mxico D.F Guadalajara Monterrey 999 S7_Cd 0 5 10 15 20 25 F r e q u e n c y S7_Cd
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 6.1.2 Descripcin de variables ordinales Para la mejor comprensin del anlisis de las variables ordinales, estas se estudian mediante la distribucin de frecuencias, la grfica de barras o la grfica de sectores (cuando hay pocos valores distintos) y los estadsticos descriptivos que en este caso sern la mediana, amplitud, mximo y mnimo. Cuando tenemos una variable ordinal, pero los datos de esta variable son distintos y en gran cantidad (por ejemplo, ms de 10) se analizan como variables de intervalo. Del archivo Banco.sav, la variable ordinal es el estatus, entonces a partir de esta variable veremos el siguiente ejemplo. Empezaremos por describir la variable estatus, entonces elige Analizar Estadsticos descriptivos frecuencias, y selecciona la variable estatus y transfirela, pero ahora en el cuadro de dilogo Frecuencias: Estadsticos seleccionaras la Mediana, el Rango, el mximo y el Mnimo. Y en el cuadro de dilogo Grficos selecciona Grfico de Pie (sectores). Al presionar el botn Aceptar del cuadro de dilogo, en el visor de resultados en primer lugar encontramos la tabla en la que se muestran los estadsticos solicitados. Despus sigue la tabla con la distribucin de frecuencias. Y en ltimo lugar la grfica de pie.
Estadsticos Nivel socioeconmico
N Valid 28 Missing 1 Median 1.0000 Range 2.00 Minimum 1.00 Maximum 3.00
Tabla de frecuencia Nivel socioeconmico
Frequency Percent Valid Percent Cumulative Percent Valid Bajo 23 79.3 82.1 82.1 Medio 2 6.9 7.1 89.3 Alto 3 10.3 10.7 100.0 Total 28 96.6 100.0 Missing System 1 3.4 Total 29 100.0
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 82.1 7.1 10.7 3.6 Estatus Bajo Medio Alto Missing
Por defecto este tipo de grfico se le asigna un color determinado por sector, pero tu como usuario puedes reeditar los grficos, dando doble clic continuo sobre el grfico, y en el editor de grficos podrs cambiar el tipo de color, y puedes agregar leyendas en cada sector como en el ejemplo mostrado. 6.1.3 Descripcin de variables de intervalo Para la mejor comprensin del anlisis de las variables de intervalo, estas se estudian mediante el histograma (que es un tipo de grfico), y los estadsticos descriptivos que en este caso sern la media, rango, mximo y mnimo, y los coeficientes de asimetra y apuntamiento. Del archivo Banco.sav, la variable de intervalo o razn es la edad, entonces a partir de esta variable veremos el siguiente ejemplo. De la barra de mens elige Analizar Estadsticos descriptivos Frecuencias, selecciona y transfiere la variable edad. En este momento debers deseleccionar la opcin Mostrar tablas de frecuencias. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Para visualizar el grfico que corresponde a este caso al histograma pulsa el botn Grficos y selecciona Histogramas y la opcin Con curva normal, al hacer esto sobre el grfico del histograma veremos sobre impresa la curva correspondiente a la distribucin normal. Presiona el botn Continuar. Ahora en el cuadro de dilogo principal presiona el botn Estadsticos, en donde en el cuadro deberps seleccionar los estadsticos necesarios; selecciona la media, la Desviacin Tpica o estndar, el rango, el mnimo y mximo, la asimetra y la curtosis. Presiona el botn Continuar y depuse el botn aceptar. En la siguiente tabla se muestran los estadsticos que solicitamos a SPSS calculara de la variable. Estadsticos Edad
N Vlidos 28 Perdidos 1 Media 47.89 Desv. tp. 8.094 Asimetra -.094 Error tp. de asimetra .441 Curtosis -.924 Error tp. de curtosis .858 Mnimo 32 Mximo 60
30 35 40 45 50 55 60 S3_Edad 0 2 4 6 8 10 F r e c u e n c i a Mean = 47.89 Std. Dev. = 8.094 N = 28 Histograma
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n El coeficiente de Asimetra mide la concentracin de valores con respecto a la curva de la distribucin normal, en nuestro ejemplo la asimetra tiene un valor de 0.094, es decir que existe una mayor concentracin de valores a la izquierda de la media que a su derecha. El coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor de la zona central de la distribucin, en nuestro ejemplo la curtosis tiene un valor de 0.924, es decir que se presenta un reducido grado de concentracin alrededor de los valores centrales de la variable, en este caso se trata de una distribucin platicrtica. 6.2 DESCRIPCIN DE VARIABLES POR GRUPOS (MEANS) En el tema anterior, aprendimos a analizar los diferentes tipos de variables de forma individual con los que comnmente nos encontraremos, pero SPSS no nos limita a estudiar un tipo de variable de forma individual, no, en SPSS tenemos la ventaja de analizar variables de un tipo en funcin de otra variable de distinto tipo, es decir podemos describir las variables cuantitativas en funcin de una o ms variables cualitativas. La manera en la que puedes hacer uso de la herramienta que te permite describir variables por grupo es presionando de la barra de mens el botn Analizar Comparar medias Medias, en el cuadro de dilogo principal selecciona y transfiere la variable edad (cuantitativa) al apartado Dependientes, despus debers seleccionar y transferir la variable Edo_Civil (cualitativa) al apartado Independientes y finalmente presiona el botn Aceptar. Informe
Edad
Edo_Civil Media N Desv. tp. Casado o Unin libre 49.39 18 7.808 Soltero 41.60 5 9.864 Divorciado o Separado 49.75 4 5.252 Total 48.00 27 8.228
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n La tabla anterior vemos la manera en la que SPSS muestra los resultados del anlisis de la variable edad en funcin de la variable Edo_Civil, y como podrs observar muestra algunos estadsticos, como la media como estadstico principal, el nmero de casos por grupo y la desviacin estndar por grupo, estos estadsticos son los que se generan por defecto, pero si presionas el botn Opciones en el cuadro de dilogo principal Medias podrs activar otros estadsticos descriptivos de utilidad. Para poder hacer uso de los estadsticos que no estn por defecto, selecciona y transfiere a Estadsticos de casilla los estadsticos que desees hallar para cada grupo, tambin podrs obtener un anlisis de varianza de una va y una prueba de linealidad para la primera variable de la ventana Independientes. Una vez seleccionados los estadsticos deseados presiona el botn Continuar y despus el botn Aceptar. 6.2.1 Descripcin jerrquica de variables por grupo No solo podremos describir una variable cuantitativa en funcin de una cualitativa, si no tambin se puede describir la variable cuantitativa en funcin de varias variables de clasificacin de una manera jerarquizada. Por ejemplo, podemos diferenciar por grupos de genero dentro de los grupos de estado civil. Para esto, en el cuadro de dilogo principal, debers presionar el botn Siguiente y seleccionar y transferir la variable gnero a Independientes y presionar el botn Aceptar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Informe Edad
Edo_Civil Gnero Media N Desv. tp. Casado o Unin libre Masculino 49.69 16 8.130 Femenino 47.00 2 5.657 Total 49.39 18 7.808 Soltero Masculino 34.00 1 . Femenino 43.50 4 10.279 Total 41.60 5 9.864 Divorciado o Separado Masculino 48.50 2 2.121 Femenino 51.00 2 8.485 Total 49.75 4 5.252 Total Masculino 48.74 19 8.259 Femenino 46.25 8 8.430 Total 48.00 27 8.228
En esta nueva tabla podremos ver a mejor detalle los estadsticos por subgrupo, por ejemplo, podemos decir que de los encuestados 16 son hombres que se encuentran casados o viven en unin libre con una edad media de 49,69 aos y una desviacin tpica de 8.130. 6.2.2 Grfico agrupado (de barras) Para este tipo de descripcin de variables por grupos tambin podemos determinar un tipo de grfico, con respecto al ejemplo anterior podremos generar un grfico de barras de clasificacin doble, es decir, que visualicemos la comparacin del grafico de barras para el estado civil agrupado por gnero midiendo la media de las edades para ambos grupos. Y lo hacemos de la siguiente manera: 13) De la barra de mens presiona el botn Grficos Barras..., en el cuadro de dilogo selecciona el tipo de grfico Agrupado y presiona el botn Definir. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 14) En el siguiente cuadro de dilogo activa la casilla Otra funcin de resumen, despus selecciona y transfiere la variable edad al apartado Variable, selecciona y transfiere la variable Edo_Civil al apartado Eje de categoras, por ltimo selecciona y transfiere la variable gnero al apartado Definir grupos por y finalmente presiona el botn Aceptar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
La grfica muestra la media de las edades respecto a la variable genero agrupados por el estado civil, la media se obtuvo por defecto, pero podemos seleccionar otro tipo de estadstico si as lo deseamos y esto lo hacemos en el segundo cuadro de dilogo presionando el botn Cambiar resumen y podremos seleccionar el estadstico deseado. El grfico fue personalizado. 6.3 DESCRIPCIN RPIDA DE VARIABLES CUANTITATIVAS (DESCRIPTIVES) Cuando solo deseamos visualizar los estadsticos de una o ms variables cuantitativas sin tener la necesidad de visualizar tablas de frecuencias podemos hacer uso del comando descriptivos, y lo hacemos de la siguiente manera, presiona de la barra de mens el botn Analizar Estadsticos descriptivos Casado o Unin libre Soltero Divorciado o Separado Edo_Civil 0 10 20 30 40 50 60 M e d i a E d a d 49.69 34 48.5 47 43.5 51 Gnero Masculino Femenino Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Descriptivos, en el cuadro de dilogo selecciona y transfiere la o las variables que desees al apartado variables, despus presiona el botn Aceptar. Los estadsticos que visualizaras en el visor de resultados por defecto son la media, desviacin tpica, mnimo y mximo. Al presionar el botn Opciones podrs seleccionar algunos estadsticos ms. En el cuadro de dilogo Descriptivos tienes la opcin de crear una nueva variable en el visor de datos que te mostrara las puntuaciones tpicas de cada una de los valores correspondientes a la variable en uso, solo debers seleccionar Guardar valores tipificados como variables y al presionar el botn Aceptar, adems de que tendrs los resultados estadsticos en el visor de resultados en la Vista de datos se creara una nueva variable con los valores tipificados. 6.4 DESCRIPCIN DETALLADA DE VARIABLES Y GRUPOS (EXAMINE) Adems de que podemos hallar la distribucin de frecuencias y los estadsticos hasta ahora vistos, podemos aadir un nuevo tipo de grfico que es el llamado Grfico de cajas, y tambin nos servir para describir variables cuantitativas en funcin de variables de clasificacin (grupales), con el uso de esta herramienta a comparacin de MEANS podemos obtener una mayor cantidad de estadsticos descriptivos y la obtencin de las grficas citadas. Elige de la barra de mens Analizar Estadsticos descriptivos Explorar, y en el cuadro de dilogo selecciona y transfiere la variable cuantitativa al apartado Dependientes, y en el apartado Factores agrega la o las variables cualitativas y presiona el botn Aceptar. En el cuadro de dilogo principal tienes la oportunidad de decidir si deseas visualizar o el grfico o solo los estadsticos, o ambos a la vez si lo deseas, por defecto obtendrs los estadsticos y el grfico de cajas, pero si presionas el botn Grficos puedes desactivar el grafico de caja o activar el grafico histograma y visualizar ambos. Respecto a los estadsticos, pulsando el botn Estadsticos podrs agregar Los Valores atpicos y los Percentiles. Pulsa el botn Continuar y por ltimo el botn Aceptar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Una vez presionado el botn Aceptar en el visor de resultados visualizaremos los estadsticos por subgrupos y los grficos de tallo y hojas y el grfico de cajas tambin por grupos, en este caso la edad en funcin del estado civil. 6.4.1 Grfico de tallo y hojas El grfico de tallo y hojas es otra forma de mostrar la distribucin de frecuencias de cada uno de los valores analizados, y este tambin divide la muestra en intervalos y es en donde visualizamos el nmero de casos comprendidos en cada intervalo. Y cada intervalo es de 10 unidades (en este ejemplo ser de 10 aos). Frecuencia Tallo Hoja 2 3 79 8 4 00347789 6 5 155789 2 6 00
En el ejemplo, el primer tallo que es el intervalo 3 (que va de 30 a 39) hay dos sujetos (Frecuencia) y al observar las hojas se ven los valores 7 y 9, es decir, que hay 2 sujetos en el intervalo uno con la edad 37 y otro con la edad 39. En el intervalo 4 (que va de 40 a 49) hay 8 sujetos y las edades son: 40, 40, 43, 44, 47, 47, 48 y 49. Y as para cada tallo y hoja. Tambin este grfico nos mostrara la existencia de valores extremos.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 6.4.2 Grfico de cajas El grfico de cajas o tambin conocido como grfico de bigotes nos muestra las medidas de posicin, dentro de las cuales tenemos los percentiles y la mediana, es decir la altura de la caja representa la amplitud intercuartil, en ella esta representado el 50% de la muestra.
6.4.3 El caso extremo y la necesidad de eliminarlo En el ejemplo del grfico de cajas existe un valor extremo para el subgrupo Soltero, generalmente un valor extremo en cualquier tipo de anlisis provoca desajustes de medicin, por ejemplo en el grfico anterior en donde existe un valor extremo vemos que la desviacin estndar para el subgrupo Soltero es de 9.86, pero si omitimos el caso extremo para el subgrupo Soltero que en este caso es el 14, entonces el valor de la desviacin estndar disminuye de manera significativa pues en este caso ser de 5.56, entonces como vemos la existencia de un caso extremo nos arrojara mediciones no representativas. Casado o Unin libre Soltero Divorciado o Separado Edo_Civil 30 35 40 45 50 55 60 E d a d 14 Percentil 75 Percentil 25 Mediana Caso extremo Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 6.4.4 Grfico agrupado (de cajas) Tambin SPSS nos da la facilidad de mostrar grficos de cajas por grupos, por ejemplo si deseamos visualizar el grafico de cajas para de la edad en funcin del estado civil, pero adems agrupados por genero, hacemos lo siguiente: - Presiona de la barra de mens el botn Grficos Diagramas de caja... - Del cuadro de dilogo selecciona opcin Agrupado y presiona el botn Definir. - En el siguiente cuadro de dilogo selecciona la variable edad y transfirela al apartado Variable, despus selecciona la variable Edo_civil y transfirela al apartado Eje de categoras y finalmente selecciona la variable genero y transfirela al apartado Definir las agrupaciones por: y despus presiona el botn Aceptar. Finalmente visualizaremos el grfico dividido en dos grupos, uno para hombres y otro para mujeres en el visor de resultados, y junto con el grfico visualizaremos una tabla con el resumen del procesamiento de los casos. Casado o Unin libre Soltero Divorciado o Separado Edo_Civil 30 35 40 45 50 55 60 E d a d S6_Gen Masculino Femenino Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 6.5 VARIABLES MULTIRESPUESTA (MULT RESPONSE) Con la ayuda de SPSS tambin podremos analizar los tipos de preguntas que se encuentren en una encuesta, ahora bien, dentro de los tipos de preguntas que generalmente componen una encuesta son de tipo dicotmico o de tipo categrico; las preguntas dicotmicas son aquellas que slo admitirn dos posibilidades de respuesta: donde se responda si (valor 1, por ejemplo) o se responda no (valor 2, por ejemplo), las preguntas de tipo categrico son aquellas que se emplean cuando hay un gran nmero de respuestas posibles y se limita el nmero total de respuestas o se comprueba que slo se responde un nmero menor de todas las posibles respuestas, por ejemplo, de una pregunta hay 10 posibles respuestas pero se limita a un mximo de 5. Por ejemplo, tomando una pequea muestra de 10 individuos de nuestro archivo Banco.sav donde se les pide contesten si o no a quienes tengan negocio propio (d1) y si o no quienes tienen cuenta bancaria en el extranjero (d2) estas sern las preguntas dicotmicas, y solo abra una pregunta categrica pidiendo que de 10 bancos solo seleccionen a los 5 que tengan ms confianza. Gnero Estado d1 d2 b1 b2 b3 b4 b5 Mujer Casado No Si Banamex BBVA HSBC Am. Express IXE Hombre Casado Si No Banamex BBVA Am. Express IXE Inbursa Hombre Casado No No B. Azteca BBVA Banamex Banorte Am. Express Mujer Casado No No BBVA Banamex Inbursa Am. Express Banorte Hombre Soltero Si No Banamex BBVA Banorte Banco Azteca HSBC Hombre Casado Si No BBVA Banamex HSBC Banorte IXE Mujer Soltero Si Si BBVA B. Azteca Banamex Banorte HSBC Hombre Soltero Si No Banamex BBVA HSBC Banorte IXE Hombre Casado Si No Banorte HSBC Inbursa Am. Express S. Serfn Hombre Casado No No Banamex HSBC BBVA Banco Azteca Inbursa
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 6.5.1 Definicin de variables dicotmicas Antes de realizar cualquier anlisis con los datos de nuestra encuesta, deberemos definir los conjuntos de respuestas en SPSS y empecemos con las preguntas dicotmicas, de la barra de mens elige Analizar Respuesta mltiple Definir conjuntos. El proceso es el siguiente: 15) En el cuadro de dilogo Definir conjuntos de respuestas mltiples selecciona y transfiere las variables d1 y d2 al apartado Variables del conjunto. 16) Las variables d1 y d2 son dicotmicas por lo que en el apartado Valor contado 4 . deberemos escribir el 1 17) En el apartado Nombre deberemos escribir el nombre de la nueva variable que agrupara a las dos variables d1 y d2. 18) Presiona el botn Aadir, y la nueva variable preg_di que agrupa a d1 y d2 se agregara al apartado Conjuntos de respuestas mltiples. 19) Finalmente presiona el botn Cerrar.
4 E n e l a p a r t a d o v a l o r c o n t a d o a g r e g a m o s e l n m e r o 1 , p o r q u e e s e l v a l o r a l q u e l e c o r r e s p o n d e l a r e s p u e s t a s i , e s t o q u i e r e d e c i r q u e c u a n d o r e a l i c e m o s c u a l q u i e r a n l i s i s , p o r e j e m p l o f r e c u e n c i a s s o l o s e r n c o n t a b i l i z a d a s l a s r e s p u e s t a s a l a s q u e c o r r e s p o n d a e l s i , s i d e s e a s c o n t a b i l i z a r l a s r e s p u e s t a s a l a s q u e c o r r e s p o n d a e l n o , d e b e r s c r e a r u n a n u e v a v a r i a b l e c o n d 1 y d 2 , p e r o c o n v a l o r c o n t a d o 2 q u e c o r r e s p o n d e a n o . Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
6.5.2 Definicin de variables mltiples (categricas) Para la definicin del grupo que contendr las variables de respuesta mltiple, de la barra de mens elige Analizar Respuesta mltiple Definir conjuntos. El proceso es el siguiente: 20) En el cuadro de dilogo Definir conjuntos de respuestas mltiples selecciona y transfiere las variables b1, b2, b3, b4 y b5 al apartado Variables del conjunto. 21) Las variables b1, b2, b3, b4 y b5 son respuestas que corresponden a una sola pregunta y son categricas, por lo que debers seleccionar la opcin Categoras 5 y escribir en la casilla Rango un 1 y en la casilla hasta un 10. 22) En el apartado Nombre deberemos escribir el nombre de la nueva variable que agrupara a las variables b1, b2, b3, b4 y b5. 23) Presiona el botn Aadir, y la nueva variable preg_mul que agrupa a b1, b2, b3, b4 y b5 se agregara al apartado Conjuntos de respuestas mltiples, junto con preg_di. 24) Finalmente presiona el botn Cerrar.
5 E n e l a p a r t a d o C a t e g o r a s d e t e r m i n a m o s u n r a n g o d e 1 h a s t a 1 0 , q u e c o r r e s p o n d e a l a s 1 0 p o s i b l e s o p c i o n e s d e l a s c u a l e s s o l o 5 p o d r n s e r s e l e c c i o n a d a s . Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
6.5.3 Distribucin de frecuencias Una vez definidas las variables correspondientes, podremos realizar dos tipos de anlisis, Frecuencias o generar Tablas de contingencia, en el caso que deseemos realizar la distribucin de frecuencias, deberemos elegir Analizar Respuesta mltiple Frecuencias. En el cuadro de dilogo como notaras solo podremos visualizar aquellas variables que fueron definidas con anterioridad, en este caso solo se encuentran las variables $preg_di que corresponde a las variables dicotmicas y $preg_mul que corresponde a las variables mltiples. Puedes seleccionar una o ambas y depuse transferirlas al apartado Tablas para y por ltimo presiona el botn Aceptar. Una vez presionado el botn Aceptar, visualizaremos los resultados de la distribucin de frecuencias en nuestro visor de resultados, teniendo lo siguiente:
_
Group $preg_di preguntas dicotmicas (Value tabulated = 1) Pct of Pct of Dichotomy label Name Count Responses Cases
Negocio propio? d1 6 75.0 85.7 Banco en el extranjero? d2 2 25.0 28.6 ------- ----- ----- Total responses 8 100.0 114.3
3 missing cases; 7 valid cases _
Tr es suj et os r esponden no a l as dos opci ones Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Una vez presionado el botn Aceptar del cuadro de dilogo principal veremos dos anlisis, uno para la variable de grupo dicotmica y otra para la variable de grupo mltiple, analicemos la parte de la variable dicotmica. En la variable $pret_di hay 6 personas que responden s a la primera opcin y 2 personas que responden s a la segunda opcin. Hay 8 respuestas afirmativas en total. La columna porcentaje de respuestas (Pct of Responses) se calcula sobre el total de respuestas, es decir las 6 personas suponen el 75% (6/8*100) de las respuestas. La columna porcentaje de casos (Pct of Cases) se calcula sobre el total de casos vlidos (7), es decir las 6 respuestas afirmativas a la primera opcin son el 85.7% (6/7*100) con respecto a los sujetos validos.
Group $Preg_mu Preguntas mltiples Pct of Pct of Category label Code Count Responses Cases
0 missing cases; 10 valid cases Abbreviated Extended Name Name
$Preg_mu $Preg_mul
Respecto al anlisis de la variable mltiple $preg_mul, vemos que hay 5 personas que eligen la opcin 2, 4 personas que eligieron la opcin 3 y as para cada dato. Hay 50 elecciones en total. La columna porcentaje de respuesta (Pct of Responses) se calcula sobre el total de elecciones, es decir las 5 personas suponen el 10% (5/50*100) de las respuestas. La columna porcentaje de casos (Pct of Cases) se calcula sobre el total de casos vlidos (10), es decir las 5 personas que eligen la opcin 2 suponen el 50% (5/10*100) con respecto a los casos vlidos. 6.5.4 Tablas de contingencia Uno ms de los anlisis que podemos realizar con variables mltiples son las llamadas tablas de contingencia o tablas de distribucin de frecuencias cruzadas, en el caso de hacer este tipo de anlisis no solo visualizaremos las variables que definimos anteriormente, si no tambin podremos hacer uso de las variables que componen nuestro archivo *.sav. Para ello elegimos de la barra de mens, Analizar Respuesta mltiple Tablas de contingencia. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n En el cuadro de dilogo, como veras no solo se encuentran las variables que definimos con anterioridad ($pret_di y $pret_mul) sino que tambin podremos hacer uso de las variables que componen nuestro archivo y esto puede ser de bastante ayuda, pues por ejemplo podramos cruzar la variable genero con la variable $preg_di. 25) Del cuadro de dilogo selecciona la variable genero y transfirela al apartado Columnas. Aparecer como genero(? ?). 26) Presiona el botn Definir rangos, en Mnimo escribe el 1 y en mximo escribe el 2, estos valores numricos corresponden a hombre con el 1 y a mujer con el 2. Presiona el botn Continuar. 27) Selecciona y transfiere la variable $pret_di al apartado Filas. Si lo deseas puedes agregar una variable ms al apartado Capas, para poder visualizar la tabla en subgrupos. 28) Al presionar el botn Opciones podrs elegir de que manera deseas que se visualicen los porcentajes si por fila, columna o por totales. Finalmente presiona el botn aceptar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n El resultado se visualizara en el visor de resultados pero en modo texto. En la tabla de contingencia podemos observar que 5 personas del gnero masculino han respondido s a la primera opcin, las cuales son un 83.3% (5/6*100) del total de respuestas afirmativas a la primera opcin. Por otro lado dos personas del gnero femenino han respondido si a la segunda opcin, un 100% de las respuestas afirmativas de la segunda opcin.
* * * C R O S S T A B U L A T I O N * * * $preg_di (tabulating 1) preguntas dicotmicas by genero Genero
genero Count Hombre Mujer Row pct Row Total 1 2 $preg_di d1 5 1 6 Negocio propio? 83.3 16.7 85.7
d2 0 2 2 Banco en el extranj .0 100.0 28.6
Column 5 2 7 Total 71.4 28.6 100.0
Percents and totals based on respondents 7 valid cases; 3 missing cases
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
7.1 Introduccin a la estadstica inferencial La estadstica Inferencial, es el proceso por el cual se deducen (infieren) propiedades o caractersticas de una poblacin a partir de una muestra significativa. Uno de los aspectos principales de la inferencia es la estimacin de parmetros estadsticos. Por ejemplo, para averiguar la media, , de las edades de todos los individuos de una encuesta, se extrae una muestra y se obtiene su media, 1. La media de la muestra (media muestral), 1, es un estimador de la media poblacional, . Si el proceso de muestreo est bien realizado (es decir, la muestra tiene el tamao adecuado y ha sido seleccionada aleatoriamente), entonces el valor de , desconocido o no, puede ser inferido a partir de 1. La inferencia siempre se realiza en trminos aproximados y declarando un cierto nivel de confianza. Por ejemplo, si en una muestra de n = 500 individuos se obtiene una edad media 1 = 38 aos, se puede llegar a una conclusin del siguiente tipo: la edad media, , de todos los individuos de la encuesta est comprendida entre 37 aos y 39 aos, y esta afirmacin se realiza con un nivel de confianza de un 90%. (Esto quiere decir que se acertar en el 90% de los estudios realizados en las mismas condiciones que ste y en el 10% restante se cometer error.) Si se quiere mejorar el nivel de confianza, se deber aumentar el tamao de la muestra, o bien disminuir la precisin de la estimacin dando un tramo ms amplio que el formado por el de extremos 37 y 39. Recprocamente, si se quiere aumentar la precisin en la estimacin disminuyendo el tamao del intervalo, entonces hay que aumentar el tamao de la muestra o bien consentir un nivel de confianza menor. Finalmente, si se quiere mejorar tanto la precisin como el nivel de confianza, hay que tomar una muestra suficientemente grande. 7.2 Prueba T y Pruebas de hiptesis La PruebaT tambin conocida como t de student es una prueba estadstica que se aplica para establecer la significacin de una diferencia al comparar dos grupos. Establecer diferencias entre grupos es relevante pero no es suficiente. Es preciso, adems, determinar si la diferencia es significativa y en consecuencia debe tomarse en cuenta, o por el contrario es insignificante y no tiene mayor trascendencia para comparar grupos y por tanto es descartable. Algunos casos: La innovacin curricular introducida en una escuela produce significativamente mejores resultados de aprendizaje con la metodologa tradicional? Cul es la efectividad alcanzada por una compaa de prevencin del SIDA en la ciudad de Mxico? Responder a estas interrogantes implica en cada una de ellas establecer y juzgar una diferencia.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n El test es una herramienta que ayuda al investigador establecer la significatividad estadstica de una diferencia observada entre dos grupos. El clculo del valor de t de student requiere en trminos de la medicin de los grupos, conocer la media aritmtica, la desviacin estndar y el nmero de casos considerados. Obtenido este valor debe calcularse los grados de libertad el cual viene dado como : GL = (Na + No) 2. Encontrar el valor crtico de t o regin de rechazo de t (para ello se recurre a la tabla de valores crticos) teniendo en cuenta el nivel de significancia, por ejemplo 5%, 10%. El valor crtico se confronta con el valor calculado. Para la interpretacin se acostumbra sostener que existen dos hiptesis posibles. La hiptesis nula (Ho) que seala la igualdad de los dos grupos. Es decir la no existencia de diferencia estadstica significativa. La hiptesis alternativa (Ha) que seala la existencia de una diferencia estadsticamente significativa al comparar los grupos. La teora estadstica, se establece que si el valor observado es mayor que el valor crtico, entonces se rechaza la hiptesis nula y se acepta la hiptesis alternativa. En los captulos siguientes de este tema, adems de que veremos la forma en la que SPSS realiza la inferencia estadstica, en el tema relacionado con Prueba T para una muestra realizaremos un pequeo ejemplo digamos a mano para ver la forma en la que deberemos decidir en que momento aceptaremos o rechazaremos la hiptesis nula. 7.3 Comparacin de medias En SPSS encontraremos la herramienta Comparar medias el cual contiene varios de los procedimientos estadsticos diseados para efectuar pruebas de hiptesis sobre medias: la prueba T y el anlisis de varianza de un factor. En este captulo veremos los cuatro procedimientos en SPSS: Prueba T para una muestra, Prueba T para muestras independientes, Prueba T para muestras relacionadas y anlisis de varianza de una va. 7.3.1 Prueba T para una muestra La prueba T para una muestra permite contrastar hiptesis referidas a una media poblacional, es decir, se emplea para comprobar si la media de una muestra pertenece a una poblacin con cierta media. En el siguiente ejemplo comprobaremos si la muestra de la variable edad pertenece a una poblacin de media 44.26 aos.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Entonces, supongamos que tenemos una poblacin de 300 individuos, pero por la escasees de tiempo no podemos trabajar con toda la poblacin, entonces decidimos seleccionar de forma aleatoria una muestra de 30 individuos, una vez selecciona dicha muestra debemos comparar su media con la media poblacional, esto con el fin de saber si la muestra seleccionada nos representara a la poblacin total con una confiabilidad del 95%. Muestra: 38 37 50 38 50 60 47 49 45 46 39 57 51 37 43 40 47 31 36 39 50 47 50 42 60 41 38 37 32 37 A modo de ejemplo, y para fines didcticos realizaremos los clculos de manera convencional, es decir, a mano. Lo primero que deberemos hacer, es determinar nuestra prueba de hiptesis, es decir determinar nuestra hiptesis nula y nuestra hiptesis alternativa. Lo que deseamos con este contraste es determinar si nuestra media muestral es significativamente igual a nuestra muestra poblacional o que nuestra media muestral es significativamente diferente a la media poblacional. La prueba quedar planteada de la siguiente forma: Ho: = 44.26 vs Ha: = 44.26 Haciendo uso del estadstico T = (X - o)/(S/\n), que sigue una distribucin t de student con (n1) grados de libertad. Y con la regin crtica o regin de rechazo queda entonces R = {| (X - o)/(S/\n) | > t(n- 1,o/2)}. Entonces el valor de la media de nuestra muestra es X = 43.80, la desviacin estndar de nuestra muestra es S = 7.636 y el tamao de nuestra muestra es n = 30. Sustituyendo y resolviendo tenemos que T = - 0.3299. Por otro lado deberemos determinar el valor en tablas de t(29,0.025) = 1.699. Por lo tanto la regin de rechazo queda como sigue: R = -1.699 < -0.3299 < 1.699. Por lo tanto se acepta la hiptesis nula. Y aunque podamos pensar que ciertamente el verdadero valor de nuestra media poblacional no es 44.26, no hay una evidencia suficiente para rechazar esta hiptesis al nivel de confianza del 95%. La manera en que lo deberemos hacer con SPSS ser de la siguiente manera: 29) Una vez determinada la muestra, elegir de la barra de mens Analizar Comparar medias Prueba T para una muestra. 30) En el cuadro dilogo selecciona y transfiere la variable a contrastar al apartado Contrastar variables. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 31) En el apartado Valor de prueba debers poner el valor de la media poblacional, que en este caso es 44.26. 32) En el botn Opciones podrs modificar el porcentaje de confiabilidad, que de manera predeterminada se asigna un 95%. 33) Finalmente presiona el botn Aceptar.
Al presionar el botn Aceptar se obtienen las dos siguientes tablas en el visor de resultados.
Estadsticos para una muestra
N Media Desviacin tp. Error tp. de la media Edad 30 43.80 7.636 1.394
Prueba para una muestra
De estas dos tablas de la que podremos determinar si se acepta o se rechaza la hiptesis nula ser la tabla Prueba para una muestra. Vemos que el valor de t que nos ofrece la tabla es justamente el mismo que nosotros calculamos mediante la frmula del estadstico t, que es 0.330, comparndolo con la regin de rechazo vemos que se cumple lo anterior calculado, es decir R = -1.699 < -0.330 < 1.699. Por lo que No se rechazara la hiptesis nula.
Valor de prueba = 44.26 t gl Sig. (bilateral) Diferencia de medias 95% Intervalo de confianza para la diferencia Inferior Superior Edad -.330 29 .744 -.460 -3.31 2.39 Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n El resultado anterior lo podemos determinar siempre y cuando tengamos a la mano la tabla correspondiente a los valores tericos de t, pero no es la nica manera de llegar a la conclusin anterior, no, afortunadamente SPSS nos muestra otras dos alternativas de llegar a la misma conclusin sin la necesidad de compara el valor de t con el valor terico de tablas predeterminadas. Tambin podemos llegar a la misma conclusin con la probabilidad que nos presenta el apartado Bilateral, es decir, que si el resultado es significativo (p <= 0.05), se dice que la muestra no representa a la poblacin. En nuestro caso como la t(29) = -0.330 tiene probabilidad <= 0.744 (es decir, mayor que 0.05), se concluye que la muestra (de media 43.80) s pertenece a la poblacin de media 44.26. La otra alternativa que SPSS nos brinda para la toma de decisiones es el intervalo de confianza. Si el intervalo de confianza no incluye el valor cero, la muestra no pertenecer a la poblacin de media dada. Si el intervalo de confianza incluye el valor cero, la muestra si ser representativa de la poblacin de media dada. En el caso presente el intervalo de (-3.31 a 2.39) incluye el cero. Entonces, de acuerdo a lo antes visto llegamos a la conclusin de que la hiptesis nula es aceptada, pues se determina que la muestra tomada aleatoriamente es representativa de la poblacional. 7.3.2 Prueba T para muestras independientes La prueba T para muestras independientes permite contrastar hiptesis referidas a la diferencia entre dos medias independientes, es decir, se comprueba por el estudio de las medias si dos grupos pueden representar ambos a la misma poblacin o que el uso de dos mtodos para el estudio de una poblacin tienen o no el mismo resultado. En el siguiente ejemplo deseamos saber si de una poblacin el grupo femenino y el grupo masculino pudieran o no representarnos a dicha poblacin para futuros anlisis con respecto a la edad, es decir que podramos tomar la muestra correspondiente a mujeres o la muestra correspondiente a hombres y que cualquiera de esas dos muestras sera representativa de toda nuestra poblacin, donde la poblacin incluye hombres y mujeres, con una confiabilidad del 95%. 34) Elige de la barra de mens Analizar Comparar medias Prueba T para muestras independientes. 35) Del cuadro de dilogo selecciona y transfiere la variable edad al apartado Contrastar variables. 36) Ahora debers seleccionar y transferir la variable que contiene los grupos, en este caso la variable genero al apartado Variable de agrupacin.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
37) Presiona el botn Definir grupos, y en el apartado Grupo 1 escribe el 1, que corresponde a los hombres, y en el apartado Grupo 2 escribe el 2, que corresponde a las mujeres. Despus presiona el botn continuar. 38) Si lo deseas puedes presionar el botn opciones, donde podrs modificar el porcentaje de confiabilidad, que de manera predeterminada se asigna un 95%. Finalmente presiona el botn Aceptar. Al presionar el botn Aceptar, los resultados sern ofrecidos en dos tablas, en el visor de resultados, de las cuales solo la segunda tabla ser de nuestro inters. Estadsticos de grupo
Genero N Media Desviacin tp. Error tp. de la media Edad Masculin o 192 45.21 8.956 .646 Femenin o 84 42.10 8.728 .952
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Prueba de muestras independientes
Se han asumido varianzas iguales No se han asumido varianzas iguales Prueba de Levene para la igualdad de varianzas F .233 Sig. .630 Prueba T para la igualdad de medias t 2.678 2.705 gl 274 162.123 Sig. (bilateral) .008 .008 Diferencia de medias 3.113 3.113 Error tp. de la diferencia 1.163 1.151 95% Intervalo de confianza para la diferencia Inferior .824 .840 Superior 5.402 5.386
La prueba de muestras independientes tiene frmulas distintas en funcin de que las varianzas de los grupos sean o no iguales. Por lo que en primer lugar se ofrece el contraste de Fisher (F) sobre homogeneidad o igualdad de varianzas. El resultado de este contraste es el que nos permite decidir si podemos o no suponer que las varianzas poblacionales son iguales: si la probabilidad asociada al estadstico de Fisher es mayor que 0.05, podremos suponer que las varianzas poblacionales son iguales; si la probabilidad asociada al estadstico de Fisher es menor que 0.05, rechazaremos la hiptesis de igualdad de varianzas y supondremos que son distintas. Empleando la prueba de Fisher F = 0.233 con p <= 0.630, como la probabilidad es mayor que 0.05 se asume que las varianzas son iguales. Por lo tanto, la prueba t adecuada hay que mirarla en la columna Se han asumido varianzas iguales. En el caso de que p <= 0.05 en la prueba de Fisher habra que mirar en la columna No se han asumido varianzas iguales. Vemos que el valor del estadstico t es de t = 2.678 con una probabilidad bilateral de 0.008. Lo cual expresaremos de la siguiente forma: t(274) = 2.678 p <= 0.008. Se compara esta probabilidad con la usual del 5% y si es menor quiere decir que existe diferencia significativa entre las medias. Aqu 0.008 < 0.05 y por lo tanto existe diferencia entre las medias. Esto nos dice que la media de edad entre la muestra de hombres y la muestra de mujeres es significativamente diferente, por ende no tendramos la certeza de que cualquiera de las dos muestras podra representarnos a la poblacin total. La prueba de hiptesis se plantea de la siguiente forma: deseamos comprobar que la media de dos muestras son significativamente iguales o que son significativamente diferentes, es decir que 1 = 2 o 1 = 2. Y la prueba de hiptesis puede ser planteada de las siguientes dos formas: Ho: 1 = 2 vs Ha: 1 = 2 o Ho: 1 - 2 = 0 vs Ha: 1 - 2 = 0 Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n La regin de rechazo o regin crtica queda determinada de la siguiente manera: m = n1 + n2 - 2
7.3.3 Prueba T para muestras relacionadas La prueba T para muestras relacionadas permite contrastar hiptesis referidas a la diferencia entre dos medias relacionadas. En el caso anterior muestras independientes- se comparan grupos de personas distintos. En el caso presente se comparan dos variables medidas en las mismas personas o personas emparejadas 6 . Hora disponemos de una poblacin de diferencias con media D, obtenida al restar las puntuaciones del mismo grupo de casos en dos variables diferentes o en la misma variable medida en dos momentos diferentes (de ah que hablemos de muestras relacionadas). Desde el punto de vista estadstico, este contraste es idntico al presentado en el apartado Prueba T para una muestra. La nica diferencia existente entre ambos contrastes es que all tenamos una muestra de puntuaciones obtenida al medir una sola variable y ahora tenemos dos muestras relacionadas que convertimos en una sola muestra de diferencias restando las puntuaciones de cada par. En el siguiente ejemplo deseamos saber si dos mtodos de enseanza tienen el mismo grado de efectividad en una misma poblacin, es decir, que las medias de efectividad de cada uno de los mtodos de enseanza tiendan o no a ser iguales con una confiabilidad del 90%.
6 Las muestras emparejadas son aquellas en las que las muestras estn relacionadas. Por ejemplo, sexo, edad, coeficiente intelectual, etc. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 39) Elige de la barra de mens Analizar Comparar medias Prueba T para muestras relacionadas. 40) Del cuadro de dilogo selecciona la variable mtodo1 y automticamente aparecer en la parte inferior, en la parte Selecciones actuales, como Variable 1. Realiza lo mismo con la variable mtodo2 y esta aparecer como variable 2. 41) Una vez hecho lo anterior podrs transferir al apartado Variables relacionadas. 42) Para modificar el porcentaje de confianza debers presionar el botn Opciones, despus presiona el botn Continuar y finalmente el botn aceptar.
Si hubiese otras variables con las cuales quisiramos realizar el contraste de medias relacionadas, deberemos realizar los pasos anteriores descritos. Al presionar el botn Aceptar del cuadro de dilogo principal, el visor de resultados nos mostrara tres tablas.
Estadsticos de muestras relacionadas
Media N Desviacin tp. Error tp. de la media Par 1 Mtodo tradicional 33.1667 12 7.10740 2.05173 Mtodo experimental 54.1667 12 5.89041 1.70042
En esta tabla visualizaremos algunos estadsticos bsicos para los dos tipos de mtodos, como la media, desviacin estndar y el error estndar de la media.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Prueba de muestras relacionadas
Par 1 Diferencias relacionadas Media -21.00000 Desviacin tp. 3.69274 Error tp. de la media 1.06600 90% Intervalo de confianza para la diferencia Inferior -22.91442 Superior -19.08558 t -19.700 gl 11 Sig. (bilateral) .000
Como resultado de la comparacin de las medias con respecto a dos mtodos diferentes de enseanza para una poblacin, haciendo uso del intervalo de confianza, llegamos a la conclusin de que existe una diferencia significativa de las medias entre ambos mtodos, por lo que se deber elegir aquel mtodo del cual su media sea superior al otro mtodo. Y llegamos a esta conclusin pues vemos que el cero no esta incluido en el intervalo (-22.91442,-19.08558). El planteamiento de la prueba de hiptesis queda de la siguiente manera: Ho: D = 0 vs Ha: D 0 con D = X-Y
La regin de rechazo es
7.3.4 ANOVA de un factor (Anlisis de varianza) Otra herramienta que SPSS nos provee para el anlisis de comparacin entre dos o ms medias es el tan famoso anlisis de varianza de un factor, el cual nos ayudara para comprobar si existen diferencias entre las medias de dos o ms grupos no relacionados, los cuales en conjunto forman una variable. Es de un factor pues solo se emplea una variable independiente generalmente una variable cualitativa. El anlisis de varianza se trata de una forma generalizada de la Prueba T para dos muestras independientes para el caso de diseos con ms de dos muestras. Cuando en el anlisis de varianza se halla una diferencia significativa entre las medias de varios grupos quiere decir que hay diferencia entre al menos dos de las medias, pero no se indica entre que medias hay diferencias. Para ello es necesario realizar un anlisis posterior, el cual comprueba la diferencia entre los pares de medias en el contexto de la muestra total.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Al igual que en los mtodos anteriores de comparacin de medias, en el anlisis de varianza tambin podemos plantear nuestra hiptesis, en donde lo que queremos corroborar o rechazar es si las medias de los grupos en estudio son significativamente iguales o al menos existe un par de ellas que no lo son, la hiptesis nula a contrastar queda como sigue: Ho: 1 = 2 = ..... = n vs Ha: i = j al menos para un par (i, j) i = j En el siguiente ejemplo deseamos comprobar si el uso de 5 telares diferentes fabrican telas con la misma resistencia, con el anlisis de varianza deseamos saber si existe algn telar que fabrique telas con menor resistencia a la de los dems.
Una vez capturados los datos en SPSS debers elegir Analizar Comparar medias ANOVA de un factor, en el cuadro de dilogo selecciona y transfiere la variable Resistencia al apartado Dependientes, despus selecciona y transfiere la variable Telares al apartado Factor. Finalmente presiona el botn Aceptar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n ANOVA
Resistencia
Suma de cuadrados gl Media cuadrtica F Sig. Inter-grupos 439.885 4 109.971 23.565 .000 Intra-grupos 98.000 21 4.667 Total 537.885 25
En la tabla de anlisis de varianza (ANOVA) lo primero es observar el valor F que es el cociente de los valores de la media cuadrtica, tenemos que F(4, 21) = 23.565 y que p <= 0.000, vemos que esta probabilidad es menor al nivel de significancia es decir 0.000 <= 0.05, llegamos a la conclusin de que hay diferencia significativa entre las medias de los cinco telares, y por lo tanto se rechaza la hiptesis nula de igualdad de medias entre los cinco grupos. 7.3.4.1 Comparacin Post Hoc El estadstico F del anlisis de varianza nicamente nos permite contrastar la hiptesis general de que las n medias comparadas son o no iguales. Al rechazar esa hiptesis (como en nuestro ejemplo), sabemos que las medias poblacionales comparadas no son iguales, pero no sabemos donde en concreto se encuentran las diferencias y podramos hacernos las siguientes preguntas: son diferentes entre s todas las medias?, hay slo una media que difiere de las dems?, etc. Para saber que media difiere de qu otra debemos utilizar un tipo particular de contrastes denominados comparaciones mltiples post hoc o comparaciones a posteriori. La manera en que podemos realizar un contraste Post hoc, es: del cuadro de dilogo principal ANOVA de un factor, debers presionar el botn Post hoc y seleccionar del apartado Asumiendo varianzas iguales la prueba de Tukey, y del apartado No asumiendo varianzas iguales seleccionar la prueba de Games- Howell, despus presiona el botn Continuar y luego el botn Aceptar. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n En las tabla Comparaciones mltiples visualizaremos todas las combinaciones posibles de las medias de resistencia por pares de los telares, tambin visualizaremos las diferencias de las medias de cada dos grupos y el nivel de significacin. Esta tabla nos marca con un asterisco las parejas que son distintas. En la tabla Subconjuntos homogneos veremos una clasificacin de los grupos que se basa en la similaridad de grado de las medias entre un nmero n de grupos. 7.3.4.2 Grfico El anlisis de varianza tambin nos ofrece la posibilidad de visualizar un grfico de lneas que nos representa la media de cada uno de los grupos de estudio, en este caso pudiramos visualizar la media de la resistencia de cada uno de los telares. Para poder activar la generacin del grfico, del cuadro de dilogo principal, debers presionar el botn opciones, del cuadro de dilogo Opciones seleccionar Grfico de las medias, despus presionar el botn Continuar y finalmente el botn Aceptar. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Telar1 Telar2 Telar3 Telar4 Telar5 Telares 45 47.5 50 52.5 55 57.5 M e d i a
d e
R e s i s t e n c i a
En estadstica las tablas de contingencia son tablas de doble entrada en las que cada entrada representa un criterio de clasificacin y se emplean para registrar y analizar la relacin entre dos o ms variables, habitualmente de naturaleza cualitativa que son aqullas que permiten clasificar o identificar la clase, nivel o categora de un individuo de una poblacin, respecto de un carcter, caracterstica o cualidad. Las tablas de contingencia son utilizadas para hallar distribuciones de frecuencias para poder calcular desde simples porcentajes hasta para obtener un complejo anlisis de independencia haciendo uso de los diferentes estadsticos que el programa nos ofrece. La forma bsica de las tablas de contingencia es de la siguiente manera:
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n TABLA DE CONTINGENCIA DE R X S
B 1 B 2 ...... B s Totales A 1 x 11 x 12 ...... x 1s n 1+
A 2 x 21 x 22 ...... x 2s n 2+
..... ... ... ...... ...
A r x r1 x r2 ...... x rs n r+
Totales n +1 n +1
n +1 n X ij = n de individuos de la muestra clasificados en la clase A y en la B. n i+ = total de la i-sima fila = n individuos de la clase A n +j = total de la j-sima columna = n de individuos de la clase B 8.1 El caso simple Veamos primero un ejemplo sencillo en el que solo calcularemos porcentajes, tenemos que en un taller se sabe que por trmino medio acuden: por la maana 3 automviles con problemas elctricos, 8 con problemas mecnicos y 3 con problemas de chapa, y por la tarde 2 con problemas elctricos, 3 con problemas mecnicos y 1 con problemas de chapa. 1) Calcula el porcentaje de los que acuden por la tarde. 2) Calcula el porcentaje de los que acuden por problemas mecnicos. 3) Calcula la probabilidad de que un automvil con problemas elctricos acuda por la maana. Para poder resolver los tres puntos anteriores, debemos elegir Analizar Estadsticos descriptivos Tablas de contingencia. Del cuadro de dilogo principal selecciona y transfiere la variable momento al apartado Filas, y en el apartado Columnas transfiere la variable problema y finalmente presionar el botn Aceptar. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Una vez presionado el botn Aceptar del cuadro de dilogo principal, nicamente visualizaremos en el visor de resultados una tabla de doble entrada de 2x3 en la que se nos mostrara las frecuencias de los datos entre las variables momento y problema.
Tabla de contingencia Momento * Problema
Recuento
Problema Total elctricos mecnicos chapa Momento maana 3 8 3 14 tarde 2 3 1 6 Total 5 11 4 20
Estos resultado no nos son suficientes puesto que en los puntos del ejemplo se nos pide obtener una serie de porcentajes, para ello en el cuadro de dilogo principal debimos presionar sobre el botn Casillas, y del cuadro de dilogo del apartado Porcentajes activar la casilla Total, despus presionar el botn Continuar y finalmente el botn Aceptar.
Tabla de contingencia Momento * Problema
Problema Total elctricos mecnicos chapa Momento maana Recuento 3 8 3 14 % del total 15.0% 40.0% 15.0% 70.0% tarde Recuento 2 3 1 6 Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n % del total 10.0% 15.0% 5.0% 30.0% Total Recuento 5 11 4 20 % del total 25.0% 55.0% 20.0% 100.0%
En esta nueva tabla adems de las frecuencias de los datos, tambin se obtienen una serie de porcentajes, todos ellos respecto al total de casos, en este ejemplo el nmero valido total es de 20. Las respuestas a las cuestiones planteadas basta leerlas en las tabla. As, se obtiene: 1) El 30% de los automviles acude al taller por la tarde. 2) El porcentaje de vehculos ingresados con problemas mecnicos es el 55%. 3) La probabilidad buscada es: P(acuda por la maana/tiene problemas elctricos) = 3/5 = 0.6 8.2 Grfico Si lo deseamos, tambin podemos generar un grfico de barras respecto a los datos que conformarn la tabla de contingencia, para esto, en el cuadro de dilogo principal deberemos activar la casilla con la frase Mostrar los grficos de barras agrupadas y presionar el botn Aceptar. 8.3 El caso complejo En el caso anterior solo generamos una tabla bidimensional, es decir solo hicimos uso de dos variables, en SPSS no es limitante el uso de tablas bidimensionales, tambin podramos utilizar tres o mas criterios, lo que nos llevara a obtener tablas tridimensionales, cuatridimensionales, etc. maana tarde Momento 0 2 4 6 8 R e c u e n t o Problema electricos mecanicos chapa Grfico de barras Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n SPSS nos permite general tablas de contingencia con cualquier nmero de dimensiones. No obstante, los estadsticos que incluye slo son tiles para analizar tablas bidimensionales. El anlisis de tablas de contingencia con ms de dos criterios de clasificacin se aborda en otros procedimientos de SPSS (por ejemplo, en el procedimiento de Modelos Loglineales no visto en este curso). SPSS permite obtener tablas de contingencia de dos dimensiones. Pero, adems, incluye la posibilidad de aadir terceras variables (variables de segmentacin) para definir subgrupos o capas y obtener as tablas multidimensionales. Tambin incluye varios estadsticos y medidas de asociacin que proporcionan la informacin necesaria para estudiar las posibles pautas de asociacin existentes entre las variables que conforman una tabla de contingencia bidimensional. 8.3.1 Estadstico X (Chi cuadrado) Este estadstico nos permitir contrastar la hiptesis de que los dos criterios de clasificacin utilizados son independientes. Entonces, X valdr cero cuando las variables sean completamente independientes, en caso contrario cuanto mayor sea su valor mayor ser la relacin entre las variables. Si los datos son compatibles con la hiptesis de independencia, la probabilidad asociada al estadstico X ser alta (mayor de 0.05). Si esa probabilidad es muy pequea (menor de 0.05), consideraremos que los datos son incompatibles con la hiptesis de independencia y concluiremos que las variables estudiadas estn relacionadas. En el siguiente ejemplo veremos como obtener e interpretar el estadstico X en una tabla de contingencia bidimensional, donde compararemos y determinaremos si estan o no relacionadas la variable Genero con la variable Estado civil. - Del cuadro de dilogo principal presiona el botn Estadsticos, y del subcuadro de dilogo activa la casilla Chi-cuadrado. Despus presiona el botn Continuar y finalmente Aceptar.
Pruebas de chi-cuadrado
Valor gl Sig. asinttica (bilateral) Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Chi-cuadrado de Pearson 29.486(a) 3 .000 Razn de verosimilitud 27.962 3 .000 Asociacin lineal por lineal 19.656 1 .000 N de casos vlidos 298 a 2 casillas (25.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 1.54.
Vemos que el estadstico Chi-cuadrado toma un valor de 29.486, el cual, en la distribucin X con 2 grados de libertad, tiene una probabilidad (Significancia asintotica = 0.000), es decir 0.000<= 0.05. Puesto que esta probabilidad es muy pequea, decidimos rechazar la hiptesis de independencia y concluir que las variables Gnero y Estado civil estn relacionadas. 8.3.2 Estadstico exacto de Fisher Este estadstico solo har su aparicin cuando se trate de comparar el grado de relacin entre variables dicotmicas. Y se lee de la misma forma en la que se hace con el estadstico Chi-cuadrado. 8.3.3 Phi y V de Cramer El grado de asociacin entre dos variables se puede evaluar empleando distintos coeficientes: el ms simple es el coeficiente Phi y puede oscilar entre 0 (que indica que no existe asociacin entre las variables) y 1 (asociacin total).
Dos de los principales intereses que surgen en el anlisis de datos, es comparar grupos y estudiar relaciones. En captulos anteriores ya hemos visto la manera en la que podemos comparar grupos, por ejemplo Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n comparar una variable cuantitativa con variables cualitativas. En este capitulo estudiaremos la relacin entre variables cuantitativas. Dentro del anlisis de correlacin bivariada tenemos una serie de coeficientes que nos ayudan a medir el grado de relacin existente entre dos o ms variables cuantitativas, SPSS nos permite hacer uso del coeficiente de correlacin de Pearson (uno de los ms famosos), el coeficiente de correlacin de Spearman y el coeficiente de correlacin de Kendall, estos dos ltimos para el anlisis de variables ordinales. El anlisis de correlacin parcial nos ayudara a eliminar el efecto de terceras variables en el anlisis de correlacin de Pearson cuando se trata de realizar el anlisis entre dos variables. 9.1 Correlacin Bivariada SPSS nos permite hacer uso de tres coeficientes de correlacin, los cuales nos ayudaran a medir el grado de relacin existente entre dos o ms variables: Pearson, Spearman y Tau-b de Kendall. Los coeficientes de correlacin, cualquiera, mide el grado de relacin existente, ahora bien, este grado de relacin solo nos mostrara que tan fuerte estn vinculadas dos o ms variables entre si, el grado de relacin no mide dependencia entre las variables, es decir, la correlacin no indica nada respecto a las razones que pudieran explicar la existencia de esta relacin. Slo indica que dos o ms variables varan en forma conjunta: la correlacin en s misma slo sirve como ndice del grado de relacin. Los tres coeficientes de correlacin de los que podemos hacer uso en SPSS tienen un rango de medida de entre menos uno a uno positivo, incluido el cero. Cuando el valor numrico que nos muestra el coeficiente de correlacin es negativo, decimos que existe una relacin negativa, es decir que mientras que el valor de una variable aumenta, el valor de la otra variable disminuye; cuando el valor numrico que nos muestra el coeficiente de correlacin es positivo, decimos que existe una relacin positiva, es decir que cuando el valor de una variable aumenta, el valor de la otra variable tambin aumenta; y que cuando el valor numrico de nos muestra el coeficiente de correlacin es cero, esto nos dice que no existe relacin entre los valores de variables diferentes, por lo que se tendra que estudiar su relacin por otros medios.
a) Relacin Positiva b) Relacin Negativa Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 0.00 2.00 4.00 6.00 8.00 10.00 X 0.00 2.00 4.00 6.00 8.00 10.00 Y
c) Relacin nula d) Relacin Nula
En las figuras anteriores podemos observar por medio de grficos llamados Grficos de dispersin la relacin que existe entre dos variables diferentes, si calculramos el coeficiente de correlacin de la figura a y la figura b, los coeficientes obtenidos serian perfectos, es decir, que para la figura a el coeficiente de correlacin sera de 1, esto quiere decir que cuando el valor de una variable aumenta, el valor de la otra 0.00 2.00 4.00 6.00 8.00 10.00 X 0.00 2.00 4.00 6.00 8.00 10.00 Z 0.00 2.00 4.00 6.00 8.00 10.00 X 0.00 1.00 2.00 3.00 4.00 5.00 6.00 W 0.00 1.00 2.00 3.00 4.00 5.00 6.00 V 0.00 2.00 4.00 6.00 8.00 10.00 Y Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n variable tambin aumenta en la misma proporcin; y el coeficiente de correlacin de la figura b sera de 1, esto quiere decir que mientras los valores de una variable aumentan, los valores de la otra variable disminuyen en la misma proporcin; y en la figura c y d el coeficiente de relacin sera de cero, pues no vemos ese crecimiento o decrecimiento de ninguna variable con respecto a la otra. La forma en la que haremos uso de la herramienta de correlacin en SPSS, es de la siguiente forma: de la barra de mens elige Analizar Correlaciones Bivariadas, selecciona y transfiere las variables cuantitativas que desees correlacionar, el anlisis que SPSS lleva acabo de las variables es por pares de ah el nombre de correlacin bivariada y finalmente presionar el botn Aceptar. Si lo deseas puedes elegir el tipo de coeficiente de correlacin que desees, el coeficiente de Pearson es el que esta por defecto, pero si lo refieres puedes hacer uso de los coeficientes de Spearman y kendall que surten mejor efecto en variables que sean ordinales.
9.2 Correlacin Parcial El hacer uso de la correlacin parcial nos permite estudiar la relacin lineal existente entre dos variables controlando el posible efecto de una o ms variables extraas. El coeficiente de correlacin parcial es una Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n tcnica de control estadstico que expresa el grado de relacin lineal existente entre dos variables tras eliminar de ambas el efecto atribuible a terceras variables. Para poder hacer uso de la correlacin parcial en SPSS, debers elegir de la barra de mens Analizar Correlaciones Parciales, en el apartado Variables transfiere las variables que desees correlacionar y en el apartado Controlando para agrega la variable de la cual deseas quitar los efectos en las variables anteriores, y finalmente presiona el botn Aceptar.
9.3 Grfico de dispersin Este tipo de grfico resulta bastante til cuando deseamos ver de manera preliminar el tipo de relacin existente entre dos o ms variables, pues este grfico nos muestra una nube de puntos consistente en un aglomerado de puntos en el que cada uno representa las puntuaciones obtenidas en las dos variables por cada caso. Como ejemplo, haremos uso de los siguientes valores y determinaremos el tipo de relacin existente entre las variables.
Y -6.1 -0.5 7.2 6.9 -0.2 -2.1 -3.9 3.8 x -2 0.6 1.4 1.3 0 -1.6 -1.7 0.7
Elige de la barra de mens Grficos Dispersin, como solo se trata de graficar dos variables selecciona la alternativa Simple, en el cuadro de dilogo principal, selecciona y transfiere a la variable dependiente al apartado Eje Y, y en el apartado Eje X transfiere la variable independiente, y despus presiona el botn Aceptar. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Si lo deseas puedes agregar una variable en el apartado Establecer marcas por, esta variable generara marcas en el grfico de dispersin, por ejemplo si agregaras la variable sexo, los puntos del grfico se verian diferenciados por una marca diferente para hombres y mujeres.
Al visualizar el grafico de dispersin, puedo determinar rpidamente que la relacin existente entre las variables de estudio es una relacin lineal positiva, al decir lineal positiva, es porque a travs de los puntos de la dispersin yo puedo agregar una lnea, en este caso una lnea recta, y adems veo que mientras los valores de la variable X crecen, tambin los valores de la variable Y crecen. -2.00 -1.00 0.00 1.00 2.00 X -7.50 -5.00 -2.50 0.00 2.50 5.00 7.50 Y Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
En mltiples ocasiones nos encontramos con situaciones en las que se requiere analizar la relacin entre dos variables cuantitativas o ms. Los dos objetivos fundamentales de este anlisis sern, por un lado, -2.00 -1.00 0.00 1.00 2.00 X -7.50 -5.00 -2.50 0.00 2.50 5.00 7.50 Y R Sq Linear = 0.856 Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n determinar si dichas variables estn asociadas y en qu sentido se da dicha asociacin (es decir, si los valores de una de las variables tienden a aumentar o disminuir al aumentar los valores de la otra); y por otro, estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra. La forma correcta de abordar el primer problema es recurriendo a coeficientes de correlacin (ya estudiados). Sin embargo, el estudio de la correlacin es insuficiente para obtener una respuesta a la segunda cuestin: se limita a indicar la fuerza de la asociacin mediante un nico nmero, tratando las variables de modo simtrico, mientras que nosotros estaramos interesados en modelar dicha relacin y usar una de las variables para predecir la otra. Para tal propsito se recurrir a la tcnica de regresin. Por ltimo cabe mencionar que cualquier modelo de regresin se basa en una serie de supuestos, como son: linealidad, independencia, normalidad, homocedasticidad y no-colinealidad. 10.1 Regresin Lineal Simple El objeto de un anlisis de regresin lineal simple es investigar la relacin estadstica que existe entre una variable dependiente (Y) y una ms variables independientes (X1, X2, X3, ...). Para poder realizar esta investigacin, se debe postular una relacin funcional entre las variables. Debido a su simplicidad analtica, la forma funcional que ms se utiliza en la prctica es la relacin lineal. Cuando solo existe una variable independiente, esto se reduce a una lnea recta:
= |0 + |1X
donde los coeficientes |0 y |1 son parmetros que definen la posicin e inclinacin de la recta. (Ntese que hemos usado el smbolo especial para representar el valor de Y calculado por la recta. Como veremos, el valor real de Y rara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distincin.) El parmetro |0, conocido como la ordenada en el origen, nos indica cunto es Y cuando X = 0. El parmetro |1, conocido como la pendiente, nos indica cunto aumenta Y por cada aumento de una unidad en X. Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables Y y X. En el anlisis de regresin, estas estimaciones se obtienen comnmente por medio del mtodo de mnimos cuadrados. SPSS nos proporciona la herramienta que nos ayudara a la prediccin de dicha . Con la tabla siguiente de datos determinaremos la ecuacin de la recta que nos ayudara a determinar el grado de dependencia de Y con X.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n Y -6.1 -0.5 7.2 6.9 -0.2 -2.1 -3.9 3.8 x -2 0.6 1.4 1.3 0 -1.6 -1.7 0.7 De la barra de mens elige Analizar Regresin Lineal, en el cuadro de dilogo principal selecciona y transfiere la variable Y al apartado Dependiente Y la variable X transfirela al apartado Independientes Y presiona el botn Aceptar.
Resumen del modelo
Modelo R R cuadrado R cuadrado corregida Error tp. de la estimacin 1 .925(a) .856 .833 2.00349 a Variables predictoras: (Constante), X
La tabla pivote Resumen del modelo nos muestra una correlacin bastante alta con R = 0.925 que nos indica una fuerte relacin positiva entre las variables X e Y. El valor de R = 0.856 nos indica que el 85.6% de la varianza de la variable Y est predicha por la variable X
ANOVA(b)
Modelo Suma de cuadrados gl Media cuadrtica F Sig. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 1 Regresin 143.675 1 143.675 35.794 .001(a) Residual 24.084 6 4.014 Total 167.759 7 a Variables predictoras: (Constante), X b Variable dependiente: Y
La tabla pivote ANOVA muestra el contraste para comprobar si la relacin global es significativa o no. El estadstico F nos permite contrastar la hiptesis nula de que el valor poblacional de R es igual a cero, lo cual, en el modelo de regresin simple, equivale a contrastar la hiptesis de que la pendiente de la recta de regresin vale cero, y la prueba se plantea como sigue: Ho: |1 = 0 vs Ha: |1 = 0 En nuestro ejemplo como F(1, 7) = 35.794 y que p <= 0.001, vemos que esta probabilidad es menor al nivel de significancia es decir 0.001 < 0.05, llegamos a la conclusin de que existe una relacin significativa entre la variable X y la variable Y. Es decir se rechaza la hiptesis nula de que la pendiente de la recta de la regresin vale cero.
Coeficientes(a)
Modelo Coeficientes no estandarizados Coeficientes estandarizado s t Sig. B Error tp. Beta 1 Constante 1.163 .714 1.629 .154 X 3.234 .541 .925 5.983 .001 a Variable dependiente: Y
La tabla pivote Coeficientes, encontraremos los valores de los coeficientes de la recta de regresin. En la columna Coeficientes no estandarizados se encuentran los coeficientes de regresin parcial que definiran la ecuacin de regresin en puntuaciones directas. El valor que le corresponde al coeficiente |0 que es la constante de nuestra ecuacin predictora es 1.163. Y el valor que le corresponder al coeficiente |1 que es la pendiente de nuestra ecuacin predictora es 3.234. Esto quiere decir que por cada unidad que se aumenta en la variable X, la variable Y aumenta 3,234 unidades. Segn esto, la ecuacin de regresin queda de la siguiente manera: = 1.163 + 3.234X Esto quiere decir que a cada valor de X le corresponde un pronostico en Y basado en un incremento constante de 1.163 ms 3.234 veces el valor de X. El coeficiente de Beta que encontramos en la columna Coeficientes estandarizados para el anlisis de regresin lineal simple, nos muestra la fuerte correlacin que la variable X tiene con la variable Y con 0.925, que corresponde al coeficiente de correlacin de Pearson. Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 10.2 Regresin Lineal Mltiple El objeto de un anlisis de regresin lineal mltiple es investigar la relacin estadstica que existe entre una variable dependiente (Y) y ms de una variable independiente (X1, X2, X3, ...). La diferencia que radica entre la regresin lineal simple y la mltiple, es de que la ecuacin de regresin mltiple ya no define una recta en el plano, si no un plano en un espacio multidimensional. El tratar de mostrar grficamente la relacin presente entre una variable dependiente con ms de una variable independiente resulta muy poco intuitiva, por el hecho de que si tuvisemos n variables independientes tendramos que mostrar un grfico con n+1 dimensiones, por lo que resultara muy complicado, por tal motivo nos limitaremos a partir del modelo de regresin lineal: = |0 + |1X1 + |2X2 + |3X3 + ... + |nXn De acuerdo con la ecuacin anterior, la variable dependiente se interpreta como una combinacin lineal de un conjunto de n variables independientes Xn, cada una de las cuales va acompaada de un coeficiente |n que indica el peso relativo de esa variable en la ecuacin. Tambin esta ecuacin incluye un coeficiente |0 que corresponde a un valor constante. Al igual que en el anlisis de regresin lineal simple, en este modelo tambin deberemos hallar con la ayuda de SPSS los valores numricos de los coeficientes |n para poder predecir el valor de la variable dependiente. La manera en que lo haremos con SPSS es idntica a la que realizamos en el anlisis de regresin lineal simple, de igual forma se interpretaran los resultados de las diferentes tablas pivote que nos arroje el anlisis de regresin mltiple. Slo mencionare el modo de ingresar a la herramienta que SPSS nos da para este tipo de anlisis. De la barra de mens elige Analizar Regresin Lineal, en el apartado Dependiente debers transferir la variable que corresponda, y en el apartado Independientes transferirs las variables independientes y finalmente presionar el botn Aceptar. La prueba de hiptesis correspondiente al anlisis de regresin mltiple queda de la siguiente manera: Ho: |1 = |2 = |3 = ... = |n = 0 vs Ha: |i = 0 para algn i = 1, 2, 3,..., n
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 10.3 Estimaciones Curvilineas Para poder determinar que tipo de estimacin deberemos realizar con que tipos de datos, es muy aconsejable realizar antes de cualquier anlisis un grfico de dispersin, pues el ser el que nos muestre de forma visual el tipo de relacin que pudieran existir entre nuestras variables de estudio. Algunas de las estimaciones ms comunes aparte de la regresin lineal simple y mltiple, tenemos la estimacin exponencial, cbica, cuadrtica, logartmica, entre otras. En este captulo ejemplificaremos algunas de ellas. Y haremos uso de los siguientes datos.
X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Y 33 27 22 22 19 18 19 16 12 14 14.5 13.5 11 12.5 12.25 13 12 Al final debers de tener la habilidad de determinar que tipo de estimacin resulta mejor para el anlisis de los datos anteriores 10.3.1 Estimacin Exponencial De la barra de mens elige Analizar Regresin Estimacin curvilnea, del cuadro de dalogo transfiere la variable Y al apartado Dependientes y la variable X transfirela al apartado independiente, y del apartado Modelos deselecciona Lineal y selecciona Exponencial, finalmente presiona el botn Aceptar.
Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n
Independent: X
Dependent Mth Rsq d.f. F Sigf b0 b1
Y EXP .826 15 71.23 .000 27.1655 -.0570
El modelo de estimacin exponencial queda como sigue: = |0 e^(|1X) = 27.1655 e^(-0.0570X)
10.00 15.00 20.00 25.00 30.00 35.00 0.00 5.00 10.00 15.00 20.00 X Observada Exponencial Y Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 10.3.2 Estimacin logartmica De la barra de mens elige Analizar Regresin Estimacin curvilnea, del cuadro de dilogo transfiere la variable Y al apartado Dependientes y la variable X transfirela al apartado independiente, y del apartado Modelos deselecciona Lineal y selecciona Logartmico, finalmente presiona el botn Aceptar.
Independent: X
Dependent Mth Rsq d.f. F Sigf b0 b1 Y LOG .950 15 285.37 .000 31.7394 -7.4263 El modelo de estimacin logartmico queda como sigue: = |0 + |1 LnX = 31.7394 7.4263 LnX
10.00 15.00 20.00 25.00 30.00 35.00 0.00 5.00 10.00 15.00 20.00 X Observada Logartmico Y Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 10.3.3 Estimacin cuadrtica De la barra de mens elige Analizar Regresin Estimacin curvilnea, del cuadro de dilogo transfiere la variable Y al apartado Dependientes y la variable X transfirela al apartado independiente, y del apartado Modelos deselecciona Lineal y selecciona Cuadrtico, finalmente presiona el botn Aceptar.
Independent: X
Dependent Mth Rsq d.f. F Sigf b0 b1 b2
Y QUA .937 14 104.07 .000 33.0625 -3.1052 .1142
El modelo de estimacin cuadrtico queda como sigue: = |0 + |1X + |X^2 = 33.0625 -3.1052X + 0.1142X^2
10.00 15.00 20.00 25.00 30.00 35.00 0.00 5.00 10.00 15.00 20.00 X Observada Cuadrtico Y Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n 10.3.4 Estimacin cbica De la barra de mens elige Analizar Regresin Estimacin curvilnea, del cuadro de dilogo transfiere la variable Y al apartado Dependientes y la variable X transfirela al apartado independiente, y del apartado Modelos deselecciona Lineal y selecciona Cbico, finalmente presiona el botn Aceptar.
Independent: X
Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3
Y CUB .952 13 85.10 .000 35.7426 -4.6725 .3258 -.0078
El modelo de estimacin cbico queda como sigue: = |0 + |1X + |2X^2 + |3X^3 = 35.7426 - 4.6725X + 0.3258X^2 - 0.0078X^3
10.00 15.00 20.00 25.00 30.00 35.00 0.00 5.00 10.00 15.00 20.00 X Observada Cbico Y Ma n u a l d e S P S S , B s i c o - I n t e r me d i o A u t o r : J o s L u i s G o n z l e z L e n