Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INDICE
CAPTULO 1. Generalidades del SPSS. Introduccin 1.1 Tipos de Ventanas IBM SPSS Statistics 20. 1.1.1 Ventana del editor de datos. 1.1.2 Visor 1.1.3 Editor de tablas pivote 1.1.4 Editor de grficos 1.1.5 Editor de resultados de texto 1.1.6 Editor de sintaxis 1.2 Barra de men 1.3 Barras de herramientas 1.4 Personalizar la barra de herramienta 1.4.1 Mostrar barra de herramientas 1.4.2 Para personalizar la barra de herramientas 1.4.3 Barra de herramientas de edicin 1.4.4 Para cambiar las imgenes de la barra de herramientas 1.5 Definir Variable 1.6 Formato de columna 1.7 Edicin de datos 1.7.1 Mover y copiar datos 1.7.2 Eliminar casos 1.7.3 Insertar variable 1.7.4 Buscar datos CAPTULO 2. Tratamiento y Anlisis 2.1 Construccin de la matriz de datos 2.1.1 Matriz de datos 2.1.2 Entrada de datos
4 4 4 4 6 6 7 7 7 7 7 8 8 9 10 11 11 15 15 15 16 16 16 17 17 17 17
2.2 Importacin y exportacin de archivos 2.3.1 Importacin de archivos 2.3.2 Exportacin de archivos 2.3 Transformacin de datos con IBM SPSS Statistics 20. 2.3.1 Ordenar casos 2.3.2 Fundir archivos 2.3.3 Agregar datos (casos) 2.3.4 Dividir archivos(Segmentar archivos ) 2.3.5 Seleccin de caso 2.3.6 Creacin de nuevas variables 2.3.7 Conteo de casos 2.3.8 Recodificacin de variables CAPTULO 3. Anlisis Exploratorio de Datos 3.1 Anlisis exploratorio de datos. Procedimiento Explorar 3.2 Diagramas de Cajas CAPTULO 4. Descripcin Estadstica de una variable 4.1 Datos y distribucin de frecuencias 4.2 Diagrama tallo y hojas 4.3 Representaciones grficas 4.4 Caractersticas de una distribucin 4.5 Medidas de Tendencia Central 4.6 Medidas de dispersin y su uso CAPTULO 5. Descripcin conjunta de dos variables categricas 5.1 Tablas de contingencia 5.2 Test Chi Cuadrado 5.3 Comparacin de Medias
18 18 20 22 22 23 26 30 31 35 37 39 43 43 44 46 46 48 48 52 53 53 55 55 57 57
1.1
Existen diversos tipos de ventanas en IBM SPSS Statistics: 1.1.1 Ventana del editor de datos. El Editor de datos proporciona un mtodo prctico (al estilo de las hojas de clculo) para la creacin y edicin de archivos de datos. La ventana Editor de datos se abre automticamente cuando se inicia una sesin. El Editor de datos proporciona dos vistas de los datos. 4 Lic. Martha Sevilla
Figura 1.3 Ventana del editor de datos con observaciones en IBM SPSS Statistics 20
1.1.2 Visor. Todas las tablas, los grficos y los resultados estadsticos se muestran en
el Visor. Puede editar los resultados y guardarlos para utilizarlos posteriormente. La ventana del Visor se abre automticamente la primera vez que se ejecuta un procedimiento que genera resultados. Figura 1.4 Ventana visor IBM SPSS Statistics 20.
1.1.3 Editor de tablas pivote. Con el Editor de tablas pivote es posible modificar los resultados mostrados en este tipo de tablas de diversas maneras. Puede editar el texto, intercambiar los datos de las filas y las columnas, aadir colores, crear tablas multidimensionales y ocultar y mostrar los resultados de manera selectiva. Figura 1.5 Editor de tablas pivote IBM SPSS Statistics 20.
1.2 Barra de men En el editor de datos en la lnea superior vemos el cono de IBM SPSS Statistics 20. En la lnea siguiente se presenta la barra de men general con todas sus opciones: Archivo, Edicin, Ver, Datos, Transformar, Analizar, Marketing directo, Grficos, Utilidades, Ventana, Ayuda. Cada una de estas opciones contiene distintos procedimientos para el trabajo estadstico. 1.3 Barras de herramientas Una barra de herramientas es un conjunto de botones-iconos que permiten ejecutar muchas de las funciones del IBM SPSS Statistics 20, de forma rpida y sencilla. Cada ventana tiene su propia barra de herramientas, con botones especficos adaptados a las funciones bsicas de esa ventana. AI pasar con el puntero del ratn (sin pulsar el botn) 7 Lic. Martha Sevilla
De izquierda a derecha, los conos de la barra de herramienta son los siguientes: Abrir documento de datos Guardar este documento Imprimir Recuperar los cuadros de dilogo reciente Deshacer una accin del usuario Volver a hacer una accin del usuario Ir a caso. Ir a la variable. Variables. Buscar. Insertar casos. Insertar variables. Dividir archivos. Ponderar casos. Seleccionar casos. Etiqueta de valor. Utilizar conjuntos de variables. Mostrar todas las variables. Corregir ortografa.
1.4 Personalizar la barra de herramienta Puede personalizar las barras de herramientas y crear nuevas barras de herramientas. En las barras de herramientas puede incluirse cualquier herramienta disponible, incluso la de cualquier accin de men. Adems pueden contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de procesos. 1.4.1 Mostrar barra de herramientas Utilice Mostrar barras de herramientas para mostrar u ocultar, personalizar y crear nuevas barras de herramientas. En las barras de herramientas puede incluirse cualquier herramienta disponible, incluso la de cualquier accin de men. Adems pueden contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de procesos.
1.4.2 Para personalizar la barra de herramientas En los mens, seleccione: Ver Barras de herramientas Personalizar 9 Lic. Martha Sevilla
Seleccione la accin que desee realizar con la herramienta (abrir un archivo, ejecutar un archivo. Pulse en Examinar para seleccionar un archivo o una aplicacin para asociarlos a la herramienta. Las nuevas herramientas se muestran en la categora Personales, que adems contiene los elementos de men definidos por el usuario. 1.4.3 Barra de herramientas de edicin Utilice el cuadro de dilogo Barra de herramientas de edicin para personalizar las barras de herramientas existentes y para crear nuevas barras. En las barras de herramientas puede incluirse cualquier herramienta disponible, incluso la de cualquier accin de men. Adems pueden contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de procesos.
1.4.4 Para cambiar las imgenes de la barra de herramientas Seleccione la herramienta cuya imagen desea cambiar en la barra de herramientas. Pulse en Cambiar imagen. Seleccione el archivo de imagen que desea utilizar para la herramienta. Se admiten los siguientes formatos de imagen: BMP, PNG, GIF, JPG. Las imgenes deben ser cuadradas. Las imgenes no cuadradas se recortan hasta formar un cuadrado. El tamao de las imgenes se ajusta automticamente. Para una visualizacin ptima, utilice imgenes de 16x16 pxeles para imgenes pequeas de la barra de herramientas, o de 32x32 pxeles para imgenes grandes.
1.5 Definir Variable Una vez activada la ventana Datos nuevos en IBM SPSS Statistics 20, pasamos a definir la variable correspondiente a la columna o celda seleccionada. Para ello pinchar en el men Datos y dentro del men que se desplegar, elegir la opcin Definir variable, es decir:
La ventana Vista de variables permite llevar a cabo todas las tareas relacionadas con la definicin de una variable: 1. Nombre de variable: Debe tener caracteres, que pueden ser alfabticos o numricos. o el smbolo de subrayado (_); la nica restriccin es que el primer carcter debe ser alfabtico, $ o #. 2. Tipo de datos: Los distintos tipos de datos son los siguientes; Numrico. Una variable cuyos valores son nmeros. Los valores se muestran en formato numrico estndar. El Editor de datos acepta valores numricos en formato estndar o en notacin cientfica. Coma. Una variable numrica cuyos valores se muestran con comas que delimitan cada tres posiciones y con el punto como delimitador decimal. El Editor de datos acepta valores numricos para este tipo de variables con o sin comas, o bien en notacin cientfica. Los valores no pueden contener comas a la derecha del indicador decimal. Punto. Una variable numrica cuyos valores se muestran con puntos que delimitan cada tres posiciones y con la coma como delimitador decimal. El Editor de datos acepta valores numricos para este tipo de variables con o sin puntos, o bien en notacin cientfica. Los valores no pueden contener puntos a la derecha del indicador decimal.
Notacin cientfica. Una variable numrica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base 10. El Editor de datos acepta para estas variables valores numricos con o sin el exponente. El exponente puede aparecer precedido por una E o una D con un signo opcional, o bien slo por el signo (por ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2 y 1,23+2). 12 Lic. Martha Sevilla
Fecha. Una variable numrica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj. Seleccione un formato de la lista. Puede introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas o espacios. El rango de siglo para los valores de ao de dos dgitos est determinado por la configuracin de las opciones (en el men Edicin, seleccione Opciones y, a continuacin, pulse en la pestaa Datos).
Dlar. Una variable numrica que se muestra con un signo dlar inicial ($), comas que delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden introducir valores de datos con o sin el signo dlar inicial.
Moneda personalizada. Una variable numrica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestaa Moneda del cuadro de dilogo Opciones. Los caracteres definidos en la moneda personalizada no se pueden emplear en la introduccin de datos pero s se mostrarn en el Editor de datos.
Cadena. Una variable cuyos valores no son numricos y, por lo tanto, no se utilizan en los clculos. Los valores pueden contener cualquier carcter siempre que no se exceda la longitud definida. Las maysculas y las minsculas se consideran diferentes. Este tipo tambin se conoce como variable alfanumrica.
3. Ancho de columna: Se especifica el numero de caracteres para el ancho de columna este valor debe de estar entre un rango de 1 a 40. 4. Decimales: Cantidad de decimales con las que se va a trabajar las variables de tipo cuantitativa. 5. Etiquetas de variable: Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud. Las etiquetas de variable pueden contener espacios y caracteres reservados que no se admiten en los nombres de variable. 6. Etiqueta de valor: Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente til si el archivo de datos utiliza cdigos numricos para representar categoras que no son numricas (por ejemplo, cdigos 1 y 2 para hombre y mujer).
7. Valores perdidos: Valores perdidos define los valores de los datos definidos como perdidos por el usuario. Por ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder de los datos perdidos porque la pregunta no afecta a dicho encuestado. Los valores de datos que se especifican como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayora de los clculos. Figura 1.13 Valores perdidos en IBM SPSS Statistics 20
8. Nivel de medicin: Puede especificar el nivel de medida como Escala (datos numricos de una escala de intervalo o de razn), Ordinal o Nominal. Los datos nominales y ordinales pueden ser de cadena (alfanumricos) o numricos. Nominal. Una variable se puede tratar como nominal si sus valores representan categoras que no obedecen a una ordenacin intrnseca (por ejemplo, el departamento de la empresa en el que trabaja un empleado). Algunos ejemplos de variables nominales son: regin, cdigo postal o confesin religiosa.
Ordinal. Una variable puede tratarse como ordinal cuando sus valores representan categoras con alguna ordenacin intrnseca (por ejemplo, los 14 Lic. Martha Sevilla
1.7.1 Mover y copiar datos Puede cortar, copiar y pegar valores de casillas individuales o grupos de valores en el Editor de datos. Tiene la posibilidad de: Mover o copiar un nico valor de casilla a otra casilla Mover o copiar un nico valor de casilla a un grupo de casillas Mover o copiar los valores de un nico caso (fila) a varios casos Mover o copiar los valores de una nica variable (columna) a varias variables Mover o copiar un grupo de valores de casillas a otro grupo de casillas Al mover o copiar datos, el formato original es sustituido por el formato de las nuevas columnas que pasan a ocupar. Si la conversin de formato de un dato no es posible, el dato se convierte en un valor perdido definido por el sistema.
Variable 2
2.1.2 Entrada de datos: Se selecciona el programa IBM SPSS Statistics 20 y se selecciona la opcin introducir los datos y seleccio ne ok, automticamente se visualiza la vista de variables donde se efecta la definicin para cada variable, tipo, etiqueta, etc. Esto se debe realizarse antes de introducir los datos de cada caso en Vista de datos. La Vista de datos, permite introducir datos en cualquier orden. Asimismo, se pueden introducir datos por: 1) caso: En este caso, se activar la fila correspondiente al caso y despus se pasa a introducir los datos. Es decir, una vez activada una determinada fila, el valor tecleado se almacena en la primera columna de la fila activada, el segundo valor se almacena en la segunda columna, y as sucesivamente hasta completar todos los datos del primer caso. 2) variable: cuando se teclea el primer valor y se pulsa la tecla de Intro ste se almacena en la celda correspondiente al primer caso de la primera variable, el segundo valor se almacena en la celda correspondiente al segundo caso de la primera variable, y as sucesivamente hasta completar todos los datos de la primera variable. Despus se activa la segunda variable, y se procede de la misma forma. Y as sucesivamente, hasta completar todos los datos de todas las variables. 3) Casillas individuales: Se selecciona una casilla y se introduce un valor de dato, este se muestra en le editor de la casilla. Los valores no se registran hasta que se pulsa intro o se selecciona otra casilla.
Selecciona Examinar y busca la base de datos que desea importar al programa IBM SPSS Statistics 20 y selecciona abrir, automticamente le aparecer la venta Acesso al controlador ODBC con la ubicacin de la base de dato que desea importar. Luego seleccione Aceptar y le aparecer una ventana (Figura 2.5). Figura 2.5 Ventana seleccin de datos.
Seleccione Finalizar, automticamente le aparecer la base importada. 2.2.2 Exportacin de archivos: El Asistente para la exportacin a base de datos permite: - Reemplazar los valores de los campos (columnas) de la tabla de la base de datos existente o aadir nuevos campos a una tabla. - Aadir nuevos registros (filas) a una tabla de base de datos. - Reemplazar completamente una tabla de base de datos o crear una tabla nueva. Para exportar datos a una base de datos: En los mens de la ventana del Editor de datos correspondientes al conjunto de datos que contiene los datos que se desean exportar, seleccione: Archivo Exportar a base de datos... Seleccione el origen de base de datos. En el primer panel del Asistente para la exportacin a base de datos, seleccione el origen de datos al que desea exportar los datos. Figura 2.6Asistente para la exportacin a base de datos.
Puede exportar datos a cualquier origen de base de datos para el que tenga el controlador ODBC adecuado. Una vez seleccionado el origen de datos, se indica la forma en la que se desean exportar los datos. Figura 2.7 Cuadro de dilogo para la exportacin de base de datos.
Las siguientes opciones estn disponibles para exportar datos a una base de datos: 21 Lic. Martha Sevilla
Especifique con respecto a que variable desea ordenar los casos y seleccione una de las opciones de ordenacin y seleccione Aceptar. Al editar la vista de datos, los casos estarn ordenados. 2.3.2 Fundir archivos: Es posible fundir los archivos de dos maneras diferentes:
1. Para fundir archivos con las mismas variables casos diferentes abra uno de los
archivos de datos. Los casos de este archivo aparecern primero en el nuevo archivo de datos fusionado. Elija en los mens: Datos Fundir archivos Aadir casos. Aparecer automticamente una ventana (Figura2.9) Figura 2.9. Aadir casos en uno de los archivo de datos.
Al aparecer esta ventana podr eliminar las variables que no desea incluir de la lista variables en el nuevo archivo de datos. Aada parejas de variables de la lista de variables desemparejadas que representa la misma informacin registrada con nombres diferentes en los dos archivos. Por ejemplo: el salario de un obrero podra tener el nombre de la variable Salobrer en un archivo y salario en el otro. Para seleccionar una pareja de variables desemparejadas puede enviarlas a variables del nuevo conjunto de datos activos y selecciona Aceptar. En resumen, aadir caso fusiona el archivo de datos de trabajo con otro archivo de datos que contiene las mismas variables pero diferentes casos. Las variables desemparejadas se deben a lo siguiente: Las variables definidas como datos numricos en un archivo y como datos de cadena en el otro (las variables numricas no pueden fusionarse con variables de cadena), Variables de cadenas de longitud diferentes (la longitud definida de una variable de cadena debe ser la misma en ambos archivos de datos). 2. Fundir archivos con los mismos casos pero variables diferentes (columnas). Se debe considerar lo siguiente: Los casos deben estar ordenados de la misma manera en ambos conjuntos de datos.
Si se utilizan una o ms variables clave para emparejar los casos, los dos conjuntos de datos deben estar ordenados por orden ascendente de la variable o variables clave. Los nombres de las variables del segundo archivo de datos que son duplicados de los del conjunto de datos activo se excluyen por defecto, abra uno de los archivos de datos activo se excluyen por defecto, ya que aadir variables supone que estas variables contienen informacin duplicada. Elija en los mens: Datos Fundir archivos Aadir variables. Aparecer automticamente una ventana (Figura2.11)
Seleccione el conjunto de datos o el archivo de datos IBM SPSS Statistics que va a fusionar con el conjunto de datos activo. Para seleccionar variables claves, elija las variables entre las variables del archivo externo (marcados por el signo +) en la lista de variables excluidas (Figura 2.10) Figura 2.12. Cuadro de dilogo Aadir variables.
Seleccione Emparejar los casos en las variables clave para los archivos ordenados. Aada las variables a la lista Variables clave. Las variables clave deben existir en el conjunto de datos activo y en el otro conjunto de datos. Ambos conjuntos de datos deben estar ordenados segn el orden ascendente de las variables clave y el orden de las variables de la lista Variables clave debe ser igual a su secuencia de ordenacin. 2.3.3 Agregar datos (casos): Agregar datos consiste en agrupar varios casos en uno solo. La opcin Agregar crea un nuevo archivo de datos en el que cada nuevo caso representa a un conjunto de casos del archivo de datos original. Un archivo agregado tiene, por tanto, menos casos que el archivo original. Para comprender en qu consiste agregar datos es necesario que definamos: Variables de segmentacin: Los casos del archivo original son agrupados a partir de los niveles de una o ms variables de segmentacin. Cada combinacin nica de valores de variables de segmentacin define un grupo. La variable de segmentacin, puede ser tanto numrica como de cadena.
Puede seleccionar una o ms variables de segmentacin que definan cmo deben agruparse los casos para crear datos agregados. En la figura 2.13, se ubico una variable de segmentacin de tipo numrico Sexo, lo que significa que todos 27 Lic. Martha Sevilla
La variable Salario (figura 2.13), ser el resultado de obtener, para cada nuevo caso agregado, el promedio de los salarios en todos los casos de cada segmento definido por el Sexo. Nombre y etiquetas (opcional). Las nuevas variables son nombradas, por defecto, P10_n ,si se desea cambiar el nombre asignado por defecto: Pulsar el botn Nombre y etiquetas... para acceder al cuadro de dialogo Agregar datos: Nombre y etiqueta de variable que muestra la figura 2.15.
Guardar el resultado agregado: 1. Aadir las variables agregadas al conjunto de datos activo. Las nuevas variables basadas en las funciones de agregacin se aaden al conjunto de datos activo. El propio archivo de datos no se agrega. Cada caso con los mismos valores de variables de segmentacin recibe los mismos valores para las nuevas variables agregadas. 2. Crear un nuevo conjunto de datos que contenga nicamente las variables agregadas. Guarda los datos agregados en un nuevo conjunto de datos durante la sesin actual. El conjunto de datos incluye las variables de segmentacin que definen los casos agregados y todas las variables de agregacin definidas por las funciones de agregacin. No afecta al conjunto de datos activo. 3. Escribir un nuevo archivo de datos que contenga slo las variables agregadas. Guarda los datos agregados en un archivo de datos externo. El archivo incluye las variables de segmentacin que definen los casos agregados y todas las variables agregadas definidas por las funciones de agregacin. No afecta al conjunto de datos activo. Opciones de ordenacin para archivos de datos grandes En el caso de los archivos de datos muy grandes, puede resultar ms eficiente agregar datos ordenados previamente. El archivo ya est ordenado por las variables de segmentacin. Si los datos ya se han ordenados por los valores de las variables de segmentacin, e procedimiento se ejecuta ejecucin ms rpidamente y utiliza menos memoria. Utilice esta opcin con precaucin. Los datos se deben ordenar por valores de variables de segmentacin en el mismo orden que las variables de segmentacin especificadas para el procedimiento Agregar datos. Si va a aadir variables al conjunto de datos activo, seleccione slo esta opcin si los datos se han ordenado mediante valores ascendentes de las variables de segmentacin. 29 Lic. Martha Sevilla
Los casos deben ordenarse segn los valores de las variables de agrupacin, en el mismo orden en que aparecen las variables en la lista Grupos basados en. Si el archivo de datos todava no est ordenado, seleccione Ordenar archivo segn variable de agrupacin. Los grupos de segmentacin del archivo se presentan juntos para poder compararlos a travs del botn Comparar los grupos (Figura 2.16). Los grupos de segmentacin del archivo se presentan juntos para poder compararlos. Para las tablas pivote se crea una sola tabla y cada variable de segmentacin del archivo puede desplazarse entre las dimensiones de la tabla. En el caso de los grficos se crea un grfico diferente para cada grupo y se muestran juntos en el Visor. El resultado de cada procedimiento se 30 Lic. Martha Sevilla
muestra por separado para cada grupo de segmentacin del archivo si se selecciona el botn Organizar los resultados por grupos.
Para segmentar un archivo de datos para el anlisis Elija en los mens: Datos Segmentar archivo... Seleccione Comparar los grupos u Organizar los resultados por grupos. Seleccione una o ms variables de agrupacin.
2.3.5 Seleccin de casos. En ocasiones puede interesar centrar el Anlisis en solo un grupo de casos que cumplan determinada condicin. En otras ocasiones puede que solo interese analizar una muestra aleatoria del total de casos del archivo de datos. IBM SPSS Statistics, permite seleccionar un conjunto de casos utilizando diferentes criterios: Seleccin de una muestra aleatoria de casos, seleccin de los casos que cumplen con una determinada condicin, seleccin de un nmero determinado de casos. La seleccin de casos es una opcin a la que todo usuario termina encontrando gran utilidad. Para seleccionar casos: Seleccione en los mens: Datos Seleccionar casos. (Figura 2.17)
Se observa que por defecto estn seleccionados todos los casos, es decir los anlisis se realizarn utilizando todos los casos. 1. Si se satisface la condicin. Cuando se desee seleccionar aquellos casos que satisfagan una determinada condicin lgica se activar esta opcin seleccionando el botn Si... para especificar la condicin. Si el resultado de la expresin condicional es verdadero, se selecciona el caso. Si el resultado es falso o perdido, no se selecciona el caso (Figura 2.18) Figura 2.18. Ventana de seleccin de casos si se satisface la condicin.
Con la opcin Aproximadamente se especifica el porcentaje de casos que se quieren seleccionar. Con la opcin Exactamente se especifica el nmero de casos que se quieren seleccionar. 3. Basndose en el rango del tiempo o de los casos. Selecciona los casos basndose en un rango de los nmeros de caso o en un rango de las fechas/horas (Figura 2.20). Los rangos de casos se basan en el nmero de filas que se muestra en la vista de datos. Figura 2.20 Seleccin de casos basados en rango.
4. Usar variable de filtro. Utiliza como variable para el filtrado la variable numrica seleccionada del archivo de datos. Se seleccionan los casos con cualquier valor distinto del 0 o del valor perdido para la variable seleccionada. Por ejemplo; Si la variable Sexo es una variable que en la vista de variable tiene valores : 1 = Femenino , 2 = Masculino y se desea seleccionar nicamente Femenino que toma el valor de 1 en la variable utilizada como filtro y no entraran en el anlisis los casos que tomen valor de 2 en dicha variable ( Figura 2.21)
Observe que los casos no seleccionados se marcan con una lnea diagonal en la vista de datos. Especifique los criterios de seleccin de casos (Resultado) Esta seccin controla el tratamiento de casos no seleccionados. Puede elegir una de las siguientes alternativas para tratar los casos no seleccionados: 1. Descartar casos no seleccionados. Los casos no seleccionados no se incluyen en el anlisis, pero se conservan en el conjunto de datos. Podr utilizar los casos no seleccionados ms adelante en la sesin, si desactiva el filtrado. Si selecciona una muestra aleatoria o si selecciona los casos mediante una expresin condicional, se generar una variable con el nombre filter_$ que tendr el valor 1 para los casos seleccionados y el valor 2 para los casos no seleccionados. 2. Copiar casos seleccionados a seleccionados se copiarn a un inalterado el conjunto de datos incluirn en el nuevo conjunto de el conjunto de datos original. un nuevo conjunto de datos. Los casos nuevo conjunto de datos, lo que mantendr original. Los casos no seleccionados no se datos y se mantendrn en su estado original en
3. Eliminar casos no seleccionados. Los casos no seleccionados se eliminarn del conjunto de datos. Slo se pueden recuperar los casos eliminados saliendo del archivo sin guardar ningn cambio y abrindolo de nuevo. La eliminacin de los casos ser permanente si se guardan los cambios en el archivo de datos. Si elimina los casos no seleccionados y guarda el archivo, no ser posible recuperar estos casos. 34 Lic. Martha Sevilla
Variable de destino: se especifica el nombre que se va a dar a la nueva variable. Expresin numrica: se especifica la expresin aritmtica o lgica que se va a evaluar. Esta expresin puede contener operadores aritmticos, operadores lgicos o una de las funciones que aparecen en la lista que figura debajo de este campo. Esta lista contiene funciones aritmticas, funciones estadsticas, funciones referentes a valores missing, funciones de distribucin y funciones temporales. Las constantes de cadenas deben ir entre comillas o apstrofes. Si no se selecciona casos opcionales, la nueva variable se calculara para todos los casos y se aadir al final de la vista datos. (Figura 2.23).
A veces es necesario calcular la nueva variable en un subconjunto de casos seleccionados utilizando expresiones condicionales (Figura 2.24). Figura 2.24. Calcular variable de un subconjunto de casos.
2.3.7 Conteo de casos. Para realizar el conteo de valores dentro de los casos deber seleccionar en el men Transformar, y dentro de este se selecciona la opcin Contar valores dentro de los casos, aparecer una venta (figura 2.26). Figura 2.26 Ventana de conteo de valores dentro de los casos.
Si no se selecciona casos opcionales, el conteo de valores entre los casos se aadir al final de la vista datos. (Figura 2.28). Figura 2.28 Conteo de valores en la vista de datos
Seleccione las variables que desee recodificar. Por ejemplo: Costo. Si selecciona mltiples variables, todas debern ser del mismo tipo (numricas o de cadena).Luego, deber seleccionar en Valores antiguos y nuevos y especifique cmo deben recodificarse los valores. (Figura 2.30).
Si lo desea, puede definir un subconjunto de los casos para su recodificacin como sigue: Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar valores individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos del sistema no se pueden seleccionar para las variables de cadena, ya que ninguno de los conceptos es aplicable a estas variables. Los rangos incluyen sus puntos finales y los valores definidos como perdidos por el usuario que estn dentro del rango. Valor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser el mismo tipo de datos (numrico o de cadena) que el de las variables que se van recodificar. Perdido por el sistema. Valores asignados por el programa cuando los valores de sus datos no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un campo numrico est vaco, o cuando no est definido un valor como resultado de un comando de transformacin. Los valores numricos perdidos del sistema se muestran como puntos. Las variables de cadena no pueden tener valores perdidos del sistema, ya que es lcito cualquier carcter en las variables de cadena. Perdido por el sistema o usuario. Observaciones que tienen valores que el usuario ha declarado perdidos o que son desconocidos y se les ha asignado el valor perdido del sistema, lo que se indica mediante un punto (.). 40 Lic. Martha Sevilla
Selecciona aceptar y en la vista de datos aparecern los nuevos valores para la variable Costo, definida en rangos. La recodificacin en una misma variable es un poco inusual ya que una vez creada la nueva variable no se podr recuperar la base de datos original. Recodificacin en distinta variable. El cuadro de dilogo Recodificar en distintas variables le permite reasignar los valores de las variables existentes o agrupar rangos de valores existentes en nuevos valores para una variable nueva. Por ejemplo, podra agrupar los Costos en una nueva variable que contenga categoras de rangos de Costos. Seleccione el men Transformar, y dentro de este se selecciona la opcin Recodificar en distintas variables, aparecer una venta (figura 2.32)
Seleccione las variables que desee recodificar. Por ejemplo: Costo. Introduzca el nombre y etiqueta de la nueva variable, seleccione cambiar. Luego, deber seleccionar en Valores antiguos y nuevos y especifique cmo deben recodificarse los valores. (Figura 2.30). Una vez que seleccione la manera de cmo va a recodificar a la variable selecciona Continuar y Aceptar. Automticamente en la vista de dato s aparece la nueva recodificacin de la variable con etiqueta de valor lo cual esta se deber de definir en la vista de variables (Figura 2.31). Selecciona aceptar y en la vista de datos aparecern los nuevos valores para la variable Costo1, definida en rangos (Figura 2.32). Figura 2.32. Vista de variable con la variable Costo1.
Seleccione una o ms variables dependientes. Si lo desea, puede: - Seleccionar una o ms variables de factor, cuyos valores definirn grupos de casos. - Seleccionar una variable de identificacin para etiquetar los casos. 43 Lic. Martha Sevilla
- Pulse en Opciones para manipular los valores ausentes. Aceptar. 3.2 Diagramas de Cajas. El diagrama de caja y bigotes permite analizar y resumir a un conjunto de datos univariante dado. Esta herramienta de anlisis exploratorio de datos va a permitir estudiar la simetra de los datos, detectar valores atpicos (Observaciones aisladas cuando el comportamiento se diferencia claramente del comportamiento medio del resto de las observaciones). El grfico de caja y bigotes divide los datos en cuatro reas de igual frecuencia, una caja central divide en dos reas por una lnea horizontal y otras dos reas representadas por dos segmentos verticales (Bigotes) que parten de cada lado horizontal de la caja. La mediana es la lnea horizontal en el interior de la caja, si esta lnea esta en el centro no hay asimetra. El sistema considera valores atpicos los que se encuentran a la izquierda del bigote izquierdo a la derecha del bigote derecho, mediante puntos alineados con la lnea vertical central para que sean fciles de detectar. Para obtener un diagrama de caja seleccione en el men: Grficos Cuadro de dilogo antiguo Diagramas de caja y elija simple y resmenes para distintas variables (Figura3.2). Figura 3.2 Cuadro de dilogo Diagrama de caja para distintas variables.
Para obtener diagramas de caja cuando existe una variable dependiente y un nivel de categora. Seleccione en el men: Grficos Cuadro de dilogo antiguo Diagramas de caja y elija simple y resmenes para grupos de datos (Figura 3.4). Al seleccionar Definir se obtiene la figura 3.5, en la que elije la variable motor para representar en cajas y como eje de categora origen. Luego, pulse Aceptar Figura 3.4 Cuadro de dilogo Diagrama caja para grupos de casos. Figura 3.5. Cuadro de dilogo Definir Diagrama de caja con eje de categoras.
Con las opciones de Estadsticos se solicitan los estadsticos descriptivos para las variables numricas seleccionadas, entonces se obtiene la siguiente ventana: Figura 4.2 Cuadro de dilogo opciones de Estadsticos.
Observemos que por defecto, el programa ordena de forma ascendente los resultados segn los valores que toma la variable a analizar. Si se quiere ordenar de forma descendente, se selecciona la opcin Valores descendentes. Si se desea ordenar la tabla de frecuencias resultante segn los valores de las frecuencias, en vez de por los valores de las variables, se seleccionan la opcin Frecuencias ascendentes o Frecuencias descendentes. Interpretacin de resultados a partir de la tabla de distribucin de frecuencia. 1. Supngase que se desea analizar la distribucin de frecuencia de la variab le Sexo, entonces se obtiene al seleccionar la barra de men (Figura 4.1), donde obtendremos la tabla de frecuencias en la ventana de resultados.
En la lista Elija entre, seleccione una categora de grficos. Cada categora ofrece varios tipos. Luego, Arrastre la imagen del grfico deseado al lienzo. Tambin puede pulsar dos veces en la imagen. Si en el lienzo ya aparece un grfico, el grfico de la galera sustituir al conjunto de ejes y a los elementos grficos del grfico. Arrastre variables desde la lista Variables y colquelas en las zonas de colocacin del eje Y, si est disponible, en la zona de colocacin de agrupamiento. Si una zona de colocacin del eje ya muestra un estadstico que desea utilizar, no tendr que arrastrar ninguna variable a la zona de colocacin. Slo deber aadir una variable a la zona cuando el texto de la zona sea azul. Si el texto es negro, la zona ya contiene una variable o un estadstico.
Si necesita cambiar los estadsticos o modificar los atributos de los ejes o las leyendas (como la amplitud de la escala), pulse en Propiedades del elemento. Figura 4.7 Cuadro de dilogo Propiedades del elemento.
Pude Editar el grficos para que pueda personalizar sus grficos y explorar los datos de la siguiente manera: Puede crear un grfico en IBM SPSS Statistics o abrir un archivo con grficos del Visor. Pulse dos veces en un grfico del Visor. Pulse dos veces en elemento grfico o Seleccionar un elemento grfico y elija a continuacin en los mens: Edicin Propiedades. Adems, el cuadro de dilogo Propiedades aparece automticamente al aadir un elemento al grfico.
El cuadro de dilogo Propiedades incluye una serie de pestaas que le permiten definir las opciones y realizar otros cambios en el grfico. Las pestaas que puede ver en el cuadro de dilogo Propiedades se basan en la seleccin actual. Dilogo de Propiedad para la grfica. Para cualquier cambio que realice en la grafica seleccione Aplicar. 51 Lic. Martha Sevilla
En la tabla de estadsticos caractersticas de la distribucin de la variable Costo, se tienen los siguientes resultados: N, valores validos, se refiere al total de casos en la ventana de datos. No hay valores Missing. 52 Lic. Martha Sevilla
4.5 Medidas de Tendencia Central. En el estudio de estadsticos univariados se disponen de las medidas de tendencia central tales como; Media aritmtica. Mediana. Moda. Nota: Estas medidas se pueden calcular nicamente para variables cuantitativas y cuando los casos (datos) no se encuentran agrupados por intervalos. - Supongamos que deseamos calcular y analizar las medidas de tendencia central de la variable Costo, se selecciona el men Analizar Estadsticos descriptivos Frecuencia, se ubica la variable Costo y se selecciona Estadsticos y con el mouse seleccione las medidas de tendencia central. Luego, seleccione Continuar y Aceptar. En la ventana de resultado aparecer una tabla con los estadsticos solicitada (Tabla 2. Estadsticos de tendencia central) Tabla2. Estadsticos de tendencia central de la variable Costo.
En la tabla de estadsticos de tendencia central se tienen los siguientes resultados: N, valores validos, se refiere al total de casos en la ventana de datos. No hay valores Missing. Media Mediana Moda
4.6 Medidas de dispersin y su uso. En el estudio de estadsticos univariados se disponen de las medidas de variabilidad o dispersin tales como; Valor mximo. Valor mnimo. 53 Lic. Martha Sevilla
En la tabla de estadsticos de dispersin se tienen los siguientes resultados: N, valores validos, se refiere al total de casos en la ventana de datos. No hay valores Missing. Error estndar de la media. Desviacin estndar. Varianza. Rango. Valor mnimo. Valor mximo.
. Seleccione una o ms variables de fila y una o ms variables de columna. Seleccionar una o ms variables de control. 55 Lic. Martha Sevilla
Recuentos. El nmero de casos realmente observados y el nmero de casos esperados si las variables de fila y columna son independientes entre s. Porcentajes. Los porcentajes se pueden sumar a travs de las filas o a lo largo de las columnas. Tambin se encuentran disponibles los porcentajes del nmero total de casos representados en la tabla (una capa). Residuos. Los residuos brutos no tipificados presentan la diferencia entre los valores observados y los esperados. Tambin se encuentran disponibles los residuos tipificados y tipificados corregidos. No tipificados. Diferencia entre el valor observado y el valor esperado. El valor pronosticado es el nmero de casos que se esperara encontrar en la casilla si no hubiera relacin entre las dos variables. Un residuo positivo indica que hay ms casos en la casilla de los que habra en ella si las variables de fila y columna fueran independientes. Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1. Tipificados corregidos. El residuo de una casilla (el valor observado menos el valor
Prueba No Paramtrica: procedimiento estadstico que no adopta ningn supuesto acerca de cmo se distribuye la caracterstica bajo estudio en la poblacin, y que slo requiere datos nominales u ordinales. Estas medidas son importantes porque la mayora de la informacin en la investigacin social y administrativa es de carcter nominal u ordinal, y porque no siempre estamos seguros que la caracterstica que deseamos estudiar se distribuye normalmente en la poblacin.
2 Se utiliza para hacer comparaciones entre frecuencias y no entre valores medios. 2 La de Pearson se emplea para comprobar la independencia de variables aleatorias.
Para hacer uso del Test Chi_ Cuadrado, seleccione el men: Analizar Estadsticos descriptivos Tablas de contingencia... (Grfico 5.3) Grfico 5.3. Cuadro de dilogo Tabla de contingencia para el anlisis de la chi- cuadrada.
Seleccione una o ms variables de fila y una o ms variables de columna. Seleccionar una o ms variables de control. Pulsar en Estadsticos y seleccione Chi _cuadrado ( Figura 5.4)
Continuar. Aceptar. 58
En la tabla de estadsticos Chi _Cuadrado se tienen los siguientes resultados: Chi_ Cuadrado de Pearson. Razn de verosimilitud. Asociacin lineal por lineal. N de casos vlidos.
2
El valor (muestral) del estadstico es 2651.149a; los grados de libertad (gl) son 1980, que es el resultado de la siguiente multiplicacin: (nmero de filas1)(nmero de columnas-1); y el p-valor o nivel crtico (Sig. asint. bilateral) es 0.000 (menor que el habitual nivel de significacin, = 0.05), por lo que deberamos rechazar la hiptesis nula de independencia de las variables El salario y Nivel acadmico. 5.3 Comparacin de Medias. El procedimiento Medias, calcula medias de subgrupo y estadsticos univariados relacionados para variables dependientes dentro de las categoras de una o ms variables independientes. Para obtener medias de subgrupo En los mens, seleccione: - Analizar Comparar medias Medias... (Figura 5.5)
- Seleccione una o ms variables dependientes. - Utilice uno de los siguientes mtodos para seleccionar variables independientes categricas: Seleccione una o ms variables independientes. Se mostrarn resultados individuales para cada variable independiente. Seleccione una o ms capas de variables independientes. Cada capa subdivide consecutivamente la muestra. Si tiene una variable independiente en Capa 1 y otra variable independiente en Capa 2, los resultados se mostrarn en una tabla cruzada en contraposicin atablas individuales para cada variable independiente. Si lo desea, pulse en Opciones si desea obtener estadsticos opcionales, una tabla de anlisis de varianza, eta, eta cuadrado, R, y R2. Tabla de Anova y eta. Muestra una tabla de anlisis de varianza de un factor y calcula la eta y la eta cuadrado (medidas de asociacin) para cada variable independiente de la primera capa. Contrastes de linealidad. Calcula la suma de cuadrados, los grados de libertad y la media cuadrtica asociados a los componentes lineal y no lineal, as como la razn F, la R y la R cuadrado. Si la variable independiente es una cadena corta entonces la linealidad no se calcula.