Está en la página 1de 60

Anlisis Estadstico de Datos con SPSS

15/01/2012 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

INDICE

CAPTULO 1. Generalidades del SPSS. Introduccin 1.1 Tipos de Ventanas IBM SPSS Statistics 20. 1.1.1 Ventana del editor de datos. 1.1.2 Visor 1.1.3 Editor de tablas pivote 1.1.4 Editor de grficos 1.1.5 Editor de resultados de texto 1.1.6 Editor de sintaxis 1.2 Barra de men 1.3 Barras de herramientas 1.4 Personalizar la barra de herramienta 1.4.1 Mostrar barra de herramientas 1.4.2 Para personalizar la barra de herramientas 1.4.3 Barra de herramientas de edicin 1.4.4 Para cambiar las imgenes de la barra de herramientas 1.5 Definir Variable 1.6 Formato de columna 1.7 Edicin de datos 1.7.1 Mover y copiar datos 1.7.2 Eliminar casos 1.7.3 Insertar variable 1.7.4 Buscar datos CAPTULO 2. Tratamiento y Anlisis 2.1 Construccin de la matriz de datos 2.1.1 Matriz de datos 2.1.2 Entrada de datos

4 4 4 4 6 6 7 7 7 7 7 8 8 9 10 11 11 15 15 15 16 16 16 17 17 17 17

2 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

2.2 Importacin y exportacin de archivos 2.3.1 Importacin de archivos 2.3.2 Exportacin de archivos 2.3 Transformacin de datos con IBM SPSS Statistics 20. 2.3.1 Ordenar casos 2.3.2 Fundir archivos 2.3.3 Agregar datos (casos) 2.3.4 Dividir archivos(Segmentar archivos ) 2.3.5 Seleccin de caso 2.3.6 Creacin de nuevas variables 2.3.7 Conteo de casos 2.3.8 Recodificacin de variables CAPTULO 3. Anlisis Exploratorio de Datos 3.1 Anlisis exploratorio de datos. Procedimiento Explorar 3.2 Diagramas de Cajas CAPTULO 4. Descripcin Estadstica de una variable 4.1 Datos y distribucin de frecuencias 4.2 Diagrama tallo y hojas 4.3 Representaciones grficas 4.4 Caractersticas de una distribucin 4.5 Medidas de Tendencia Central 4.6 Medidas de dispersin y su uso CAPTULO 5. Descripcin conjunta de dos variables categricas 5.1 Tablas de contingencia 5.2 Test Chi Cuadrado 5.3 Comparacin de Medias

18 18 20 22 22 23 26 30 31 35 37 39 43 43 44 46 46 48 48 52 53 53 55 55 57 57

3 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

CAPTULO 1. Generalidades del SPSS.


Introduccin El programa IBM SPSS Statistics 20, es un sistema global para el anlisis estadstico. Adems, puede adquirir datos de casi cualquier tipo de archivo y utilizarlos para generar informes tabulares, grficos y diagramas de distribuciones y tendencias, estadsticos descriptivos y anlisis estadsticos complejos. Para empezar a trabajar en este programa, basta elegir la opcin Todos los Programas del men IBM SPSS Statistics de Windows y selecciona la sub opcin IBM SPSS Statistics 20 para Windows. Se obtiene una pantalla (figura 1.1) que nos permite comenzar a trabajar con las distintas opciones. Una vez seleccionada la opcin se presiona la tecla OK. Figura 1.1 Opciones del IBM SPSS Statistics 20

1.1

Tipos de Ventanas IBM SPSS Statistics 20.

Existen diversos tipos de ventanas en IBM SPSS Statistics: 1.1.1 Ventana del editor de datos. El Editor de datos proporciona un mtodo prctico (al estilo de las hojas de clculo) para la creacin y edicin de archivos de datos. La ventana Editor de datos se abre automticamente cuando se inicia una sesin. El Editor de datos proporciona dos vistas de los datos. 4 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Vista de datos. Esta vista muestra los valores de datos reales o las etiquetas de valor definidas (Figura 1.2, 1.3). Vista de variables. Esta vista muestra la informacin de definicin de las variables, que incluye las etiquetas de la variable definida y de valor, tipo de dato (por ejemplo, cadena, fecha o numrico), nivel de medida (nominal, ordinal o de escala) y los valores perdidos definidos por el usuario. En ambas vistas, se puede aadir, modificar y eliminar la informacin contenida en el archivo de datos. Figura 1.2 Ventana del editor de datos IBM SPSS Statistics.

Figura 1.3 Ventana del editor de datos con observaciones en IBM SPSS Statistics 20

5 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

1.1.2 Visor. Todas las tablas, los grficos y los resultados estadsticos se muestran en
el Visor. Puede editar los resultados y guardarlos para utilizarlos posteriormente. La ventana del Visor se abre automticamente la primera vez que se ejecuta un procedimiento que genera resultados. Figura 1.4 Ventana visor IBM SPSS Statistics 20.

1.1.3 Editor de tablas pivote. Con el Editor de tablas pivote es posible modificar los resultados mostrados en este tipo de tablas de diversas maneras. Puede editar el texto, intercambiar los datos de las filas y las columnas, aadir colores, crear tablas multidimensionales y ocultar y mostrar los resultados de manera selectiva. Figura 1.5 Editor de tablas pivote IBM SPSS Statistics 20.

6 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


1.1.4 Editor de grficos. Puede modificar los grficos y diagramas de alta resolucin en las ventanas del los grficos. Es posible cambiar los colores, seleccionar diferentes tipos de fuentes y tamaos, intercambiar los ejes horizontal y vertical, rotar diagramas de dispersin 3-D e incluso cambiar el tipo de grfico. 1.1.5 Editor de resultados de texto. Los resultados de texto que no aparecen en las tablas pivote pueden modificarse con el Editor de resultados de texto. Puede editar los resultados y cambiar las caractersticas de las fuentes (tipo, estilo, color y tamao). 1.1.6 Editor de sintaxis. Puede pegar las selecciones del cuadro de dilogo en una ventana de sintaxis, donde aparecern en forma de sintaxis de comandos. A continuacin puede editar esta sintaxis de comandos para utilizar las funciones especiales que no se encuentran disponibles en los cuadros de dilogo. Tambin puede guardar los comandos en un archivo para utilizarlos en sesiones posteriores. Figura 1.6 Editor de sintaxis IBM SPSS Statistics 20.

1.2 Barra de men En el editor de datos en la lnea superior vemos el cono de IBM SPSS Statistics 20. En la lnea siguiente se presenta la barra de men general con todas sus opciones: Archivo, Edicin, Ver, Datos, Transformar, Analizar, Marketing directo, Grficos, Utilidades, Ventana, Ayuda. Cada una de estas opciones contiene distintos procedimientos para el trabajo estadstico. 1.3 Barras de herramientas Una barra de herramientas es un conjunto de botones-iconos que permiten ejecutar muchas de las funciones del IBM SPSS Statistics 20, de forma rpida y sencilla. Cada ventana tiene su propia barra de herramientas, con botones especficos adaptados a las funciones bsicas de esa ventana. AI pasar con el puntero del ratn (sin pulsar el botn) 7 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


por encima de una herramienta, se abre un pequeo recuadro de ayuda pista ofreciendo una breve descripcin de la funcin asociada a esa herramienta. Figura 1.7 Barra de herramienta IBM SPSS Statistics 20.

De izquierda a derecha, los conos de la barra de herramienta son los siguientes: Abrir documento de datos Guardar este documento Imprimir Recuperar los cuadros de dilogo reciente Deshacer una accin del usuario Volver a hacer una accin del usuario Ir a caso. Ir a la variable. Variables. Buscar. Insertar casos. Insertar variables. Dividir archivos. Ponderar casos. Seleccionar casos. Etiqueta de valor. Utilizar conjuntos de variables. Mostrar todas las variables. Corregir ortografa.

1.4 Personalizar la barra de herramienta Puede personalizar las barras de herramientas y crear nuevas barras de herramientas. En las barras de herramientas puede incluirse cualquier herramienta disponible, incluso la de cualquier accin de men. Adems pueden contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de procesos. 1.4.1 Mostrar barra de herramientas Utilice Mostrar barras de herramientas para mostrar u ocultar, personalizar y crear nuevas barras de herramientas. En las barras de herramientas puede incluirse cualquier herramienta disponible, incluso la de cualquier accin de men. Adems pueden contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de procesos.

8 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 1.8 Ubicacin de la barra de herramienta.

Figura 1.9 Mostrar barra de herramientas.

1.4.2 Para personalizar la barra de herramientas En los mens, seleccione: Ver Barras de herramientas Personalizar 9 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Seleccione la barra de herramientas que desea personalizar y pulse en Edicin o pulse en Nueva para crear una nueva barra de herramientas. Para las barras de herramientas nuevas, introduzca un nombre para la barra de herramientas, seleccione las ventanas en las que desea que aparezca y pulse en Edicin. Seleccione un elemento en la lista Categoras para que se visualicen las herramientas disponibles en esa categora. Arrastre y suelte las herramientas que desee en la barra de herramientas que aparece en el cuadro de dilogo. Para eliminar una herramienta de la barra de herramientas, arrstrela a cualquier punto fuera de la barra de herramientas que aparece en el cuadro de dilogo. Pulse en Nueva herramienta en el cuadro de dilogo Barra de herramientas de edicin. Introduzca una etiqueta descriptiva para la herramienta.

Seleccione la accin que desee realizar con la herramienta (abrir un archivo, ejecutar un archivo. Pulse en Examinar para seleccionar un archivo o una aplicacin para asociarlos a la herramienta. Las nuevas herramientas se muestran en la categora Personales, que adems contiene los elementos de men definidos por el usuario. 1.4.3 Barra de herramientas de edicin Utilice el cuadro de dilogo Barra de herramientas de edicin para personalizar las barras de herramientas existentes y para crear nuevas barras. En las barras de herramientas puede incluirse cualquier herramienta disponible, incluso la de cualquier accin de men. Adems pueden contener herramientas personalizadas que ejecutan otras aplicaciones, que ejecutan archivos de sintaxis de comandos o archivos de procesos.

10 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 1.10 Cuadro de dilogo Personalizar barra de herramientas

1.4.4 Para cambiar las imgenes de la barra de herramientas Seleccione la herramienta cuya imagen desea cambiar en la barra de herramientas. Pulse en Cambiar imagen. Seleccione el archivo de imagen que desea utilizar para la herramienta. Se admiten los siguientes formatos de imagen: BMP, PNG, GIF, JPG. Las imgenes deben ser cuadradas. Las imgenes no cuadradas se recortan hasta formar un cuadrado. El tamao de las imgenes se ajusta automticamente. Para una visualizacin ptima, utilice imgenes de 16x16 pxeles para imgenes pequeas de la barra de herramientas, o de 32x32 pxeles para imgenes grandes.

1.5 Definir Variable Una vez activada la ventana Datos nuevos en IBM SPSS Statistics 20, pasamos a definir la variable correspondiente a la columna o celda seleccionada. Para ello pinchar en el men Datos y dentro del men que se desplegar, elegir la opcin Definir variable, es decir:

11 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 1.11 Definir la variable de un conjunto de datos en IBM SPSS Statistics 20

La ventana Vista de variables permite llevar a cabo todas las tareas relacionadas con la definicin de una variable: 1. Nombre de variable: Debe tener caracteres, que pueden ser alfabticos o numricos. o el smbolo de subrayado (_); la nica restriccin es que el primer carcter debe ser alfabtico, $ o #. 2. Tipo de datos: Los distintos tipos de datos son los siguientes; Numrico. Una variable cuyos valores son nmeros. Los valores se muestran en formato numrico estndar. El Editor de datos acepta valores numricos en formato estndar o en notacin cientfica. Coma. Una variable numrica cuyos valores se muestran con comas que delimitan cada tres posiciones y con el punto como delimitador decimal. El Editor de datos acepta valores numricos para este tipo de variables con o sin comas, o bien en notacin cientfica. Los valores no pueden contener comas a la derecha del indicador decimal. Punto. Una variable numrica cuyos valores se muestran con puntos que delimitan cada tres posiciones y con la coma como delimitador decimal. El Editor de datos acepta valores numricos para este tipo de variables con o sin puntos, o bien en notacin cientfica. Los valores no pueden contener puntos a la derecha del indicador decimal.

Notacin cientfica. Una variable numrica cuyos valores se muestran con una E intercalada y un exponente con signo que representa una potencia de base 10. El Editor de datos acepta para estas variables valores numricos con o sin el exponente. El exponente puede aparecer precedido por una E o una D con un signo opcional, o bien slo por el signo (por ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2 y 1,23+2). 12 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

Fecha. Una variable numrica cuyos valores se muestran en uno de los diferentes formatos de fecha-calendario u hora-reloj. Seleccione un formato de la lista. Puede introducir las fechas utilizando como delimitadores: barras, guiones, puntos, comas o espacios. El rango de siglo para los valores de ao de dos dgitos est determinado por la configuracin de las opciones (en el men Edicin, seleccione Opciones y, a continuacin, pulse en la pestaa Datos).

Dlar. Una variable numrica que se muestra con un signo dlar inicial ($), comas que delimitan cada tres posiciones y un punto como delimitador decimal. Se pueden introducir valores de datos con o sin el signo dlar inicial.

Moneda personalizada. Una variable numrica cuyos valores se muestran en uno de los formatos de moneda personalizados que se hayan definido previamente en la pestaa Moneda del cuadro de dilogo Opciones. Los caracteres definidos en la moneda personalizada no se pueden emplear en la introduccin de datos pero s se mostrarn en el Editor de datos.

Cadena. Una variable cuyos valores no son numricos y, por lo tanto, no se utilizan en los clculos. Los valores pueden contener cualquier carcter siempre que no se exceda la longitud definida. Las maysculas y las minsculas se consideran diferentes. Este tipo tambin se conoce como variable alfanumrica.

3. Ancho de columna: Se especifica el numero de caracteres para el ancho de columna este valor debe de estar entre un rango de 1 a 40. 4. Decimales: Cantidad de decimales con las que se va a trabajar las variables de tipo cuantitativa. 5. Etiquetas de variable: Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud. Las etiquetas de variable pueden contener espacios y caracteres reservados que no se admiten en los nombres de variable. 6. Etiqueta de valor: Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente til si el archivo de datos utiliza cdigos numricos para representar categoras que no son numricas (por ejemplo, cdigos 1 y 2 para hombre y mujer).

13 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 1.12 Etiqueta de valor en IBM SPSS Statistics 20

7. Valores perdidos: Valores perdidos define los valores de los datos definidos como perdidos por el usuario. Por ejemplo, es posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder de los datos perdidos porque la pregunta no afecta a dicho encuestado. Los valores de datos que se especifican como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayora de los clculos. Figura 1.13 Valores perdidos en IBM SPSS Statistics 20

8. Nivel de medicin: Puede especificar el nivel de medida como Escala (datos numricos de una escala de intervalo o de razn), Ordinal o Nominal. Los datos nominales y ordinales pueden ser de cadena (alfanumricos) o numricos. Nominal. Una variable se puede tratar como nominal si sus valores representan categoras que no obedecen a una ordenacin intrnseca (por ejemplo, el departamento de la empresa en el que trabaja un empleado). Algunos ejemplos de variables nominales son: regin, cdigo postal o confesin religiosa.

Ordinal. Una variable puede tratarse como ordinal cuando sus valores representan categoras con alguna ordenacin intrnseca (por ejemplo, los 14 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


niveles de satisfaccin con un servicio, que vayan desde muy insatisfecho hasta muy satisfecho). Entre los ejemplos de variables ordinales se incluyen escalas de actitud que representan el grado de satisfaccin o confianza y las puntuaciones de evaluacin de las preferencias. Escala. Una variable puede tratarse como escala (continua) cuando sus valores representan categoras ordenadas con una mtrica con significado, por lo que son adecuadas las comparaciones de distancia entre valores. Son ejemplos de variables de escala: la edad en aos y los ingresos en dlares. Nota: Para variables de cadena ordinales, se asume que el orden alfabtico de los valores de cadena indica el orden correcto de las categoras. Por ejemplo, en una variable de cadena cuyos valores sean bajo, medio, alto, se interpreta el orden de las categoras como alto, bajo, medio (orden que no es el correcto). Por norma general, se puede indicar que es ms fiable utilizar Cdigos numricos para representar datos ordinales. 1.6 Formato de columna: Se refiere a la anchura de columna y alineacin del texto este estn incorporados en la ventana de vista de variables. 1.7 Edicin de datos: El Editor de datos puede modificar el archivo de datos de diversas maneras: Cambiar los valores de datos Cortar, copiar y pegar valores de datos Aadir y eliminar casos Aadir y eliminar variables Cambiar el orden de las variables

1.7.1 Mover y copiar datos Puede cortar, copiar y pegar valores de casillas individuales o grupos de valores en el Editor de datos. Tiene la posibilidad de: Mover o copiar un nico valor de casilla a otra casilla Mover o copiar un nico valor de casilla a un grupo de casillas Mover o copiar los valores de un nico caso (fila) a varios casos Mover o copiar los valores de una nica variable (columna) a varias variables Mover o copiar un grupo de valores de casillas a otro grupo de casillas Al mover o copiar datos, el formato original es sustituido por el formato de las nuevas columnas que pasan a ocupar. Si la conversin de formato de un dato no es posible, el dato se convierte en un valor perdido definido por el sistema.

15 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


1.7.2 Eliminar casos Para eliminar el texto seleccionado (ya sea una casilla, un caso, una variable o un conjunto de casillas): Seleccionar la opcin Borrar del men Edici6n. La tecla suprimir produce el mismo efecto. 1.7.3 Insertar variable Para insertar una variable nueva (una columna nueva entre dos variables existentes: Situar el cursor en la columna donde se desea insertar la nueva variable Seleccionar la opcin Insertar variable del men Datos, o pulsar el botn Insertar variable de la barra de herramienta. 1.7.4 Buscar datos Esta opcin permite buscar un valor concreto en los casos de la variable seleccionada (es decir, en los casos de la columna en la que se encuentra el cursor). Para buscar un dato: Seleccionar la opcin Buscar datos del men Edicin ( o pulsar el botn Buscar de la barra de herramientas) para acceder al cuadro de dialogo Buscar datos (figura 1.14).

Figura 1.14. Cuadro de dilogo Buscar datos.

16 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

CAPTULO 2. Tratamiento y Anlisis.


2.1 Construccin de la matriz de datos Antes de comenzar a construir una matriz de datos es necesario referirnos al concepto de este. 2.1.1 Matriz de datos: Es aquella que est conformada por todas las variables de importancia en un estudio y todas las unidades elementales de anlisis en una investigacin estos pueden ser: Personas, Empresas, Animales, Producto etc., su estructura est dada por la figura 2.1: Figura 2.1. Matriz de datos. Variable 1 Caso 1 Caso 2 .. Caso n . Variable m

Variable 2

2.1.2 Entrada de datos: Se selecciona el programa IBM SPSS Statistics 20 y se selecciona la opcin introducir los datos y seleccio ne ok, automticamente se visualiza la vista de variables donde se efecta la definicin para cada variable, tipo, etiqueta, etc. Esto se debe realizarse antes de introducir los datos de cada caso en Vista de datos. La Vista de datos, permite introducir datos en cualquier orden. Asimismo, se pueden introducir datos por: 1) caso: En este caso, se activar la fila correspondiente al caso y despus se pasa a introducir los datos. Es decir, una vez activada una determinada fila, el valor tecleado se almacena en la primera columna de la fila activada, el segundo valor se almacena en la segunda columna, y as sucesivamente hasta completar todos los datos del primer caso. 2) variable: cuando se teclea el primer valor y se pulsa la tecla de Intro ste se almacena en la celda correspondiente al primer caso de la primera variable, el segundo valor se almacena en la celda correspondiente al segundo caso de la primera variable, y as sucesivamente hasta completar todos los datos de la primera variable. Despus se activa la segunda variable, y se procede de la misma forma. Y as sucesivamente, hasta completar todos los datos de todas las variables. 3) Casillas individuales: Se selecciona una casilla y se introduce un valor de dato, este se muestra en le editor de la casilla. Los valores no se registran hasta que se pulsa intro o se selecciona otra casilla.

17 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


2.2 Importacin y exportacin de archivos. Los archivos guardados en formato IBM SPSS Statistics 20, puede abrir archivos de Excel, SAS, Stata, archivos delimitados por tabuladores y otros archivos sin necesidad de convertirlos a un formato intermedio ni de introducir informacin sobre la definicin de los datos. 2.2.1 Importacin de archivos: Elija en los mens: Archivo Abrir base de datos Nueva consulta. Se selecciona el origen de datos que sea compatible con IBM SPSS Statistics 20: dBase Files: dBASE IV (*.dbf). Formato dBASE IV. dBASE III (*.dbf). Formato dBASE III. dBASE II (*.dbf). Formato dBASE II. Excel files: Excel 97, Formato XLS. Excel 2007, Formato XLSX Ms Access Database: Ms Access Database, Formato DB (2000-2003) Ms Access Database, Formato DBX (2007) Luego, seleccione Siguiente y le aparecer una pantalla de la forma siguiente: Figura 2.4. Seleccin del origen de datos que se desea importar.

18 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

Selecciona Examinar y busca la base de datos que desea importar al programa IBM SPSS Statistics 20 y selecciona abrir, automticamente le aparecer la venta Acesso al controlador ODBC con la ubicacin de la base de dato que desea importar. Luego seleccione Aceptar y le aparecer una ventana (Figura 2.5). Figura 2.5 Ventana seleccin de datos.

19 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

Seleccione Finalizar, automticamente le aparecer la base importada. 2.2.2 Exportacin de archivos: El Asistente para la exportacin a base de datos permite: - Reemplazar los valores de los campos (columnas) de la tabla de la base de datos existente o aadir nuevos campos a una tabla. - Aadir nuevos registros (filas) a una tabla de base de datos. - Reemplazar completamente una tabla de base de datos o crear una tabla nueva. Para exportar datos a una base de datos: En los mens de la ventana del Editor de datos correspondientes al conjunto de datos que contiene los datos que se desean exportar, seleccione: Archivo Exportar a base de datos... Seleccione el origen de base de datos. En el primer panel del Asistente para la exportacin a base de datos, seleccione el origen de datos al que desea exportar los datos. Figura 2.6Asistente para la exportacin a base de datos.

20 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

Puede exportar datos a cualquier origen de base de datos para el que tenga el controlador ODBC adecuado. Una vez seleccionado el origen de datos, se indica la forma en la que se desean exportar los datos. Figura 2.7 Cuadro de dilogo para la exportacin de base de datos.

Las siguientes opciones estn disponibles para exportar datos a una base de datos: 21 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


- Reemplazar los valores de los campos existentes. Reemplaza los valores de los campos seleccionados en una tabla existente con valores de las variables seleccionadas en el conjunto de datos activo. - Aadir nuevos campos a una tabla existente. Crea nuevos campos en una tabla existente que contiene los valores de las variables seleccionadas en el conjunto de datos activo. Si desea obtener ms informacin. Esta opcin no est disponible para los archivos de Excel. - Aadir nuevos registros a una tabla existente. Aade nuevos registros (filas) a una tabla existente que contiene los valores de los casos del conjunto de datos activo. Si desea obtener ms informacin. - Eliminar una tabla existente y crear una tabla nueva con el mismo nombre. Elimina la tabla especificada y crea una nueva tabla con el mismo nombre que contiene variables seleccionadas del conjunto de datos activo. Toda la informacin de la tabla original, incluidas las definiciones de las propiedades del campo (como las claves primarias o los tipos de datos) se pierde. - Crear una tabla nueva. Crea una tabla nueva en la base de datos que contiene datos de las variables seleccionadas en el conjunto de datos activo. El nombre puede ser cualquier valor que est permitido como nombre de tabla por el origen de datos. El nombre no puede coincidir con el nombre de una tabla o vista existentes en la base de datos. Siga las instrucciones del asistente para exportacin para exportar los datos. 2.3 Transformacin de datos con IBM SPSS Statistics 20. En ocasiones, los datos tienen algunos tratamientos para su posterior anlisis las cuales se detallan a continuacin: 2.3.1 Ordenar casos: Esta opcin ayuda a ordenar los casos (filas) de una o varias variables de ordenacin en forma ascendente o descendente. Para ordenar casos se debe de considerar lo siguiente: Si se seleccionas ms de una variable de ordenacin, los casos se ordenaran por variables dentro de las categoras de la variable anterior de la lista Ordenar por. Por ejemplo, si selecciona Sexo como la primera variable de ordenacin y gastos como la segunda, los casos se ordenarn por gastos dentro de cada categora de sexo. Para ordenar casos elija en los mens Datos Ordenar casos, aparecer una ventana (Figura 2.8)

22 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura2.8. Cuadro de dilogo Ordenar casos.

Especifique con respecto a que variable desea ordenar los casos y seleccione una de las opciones de ordenacin y seleccione Aceptar. Al editar la vista de datos, los casos estarn ordenados. 2.3.2 Fundir archivos: Es posible fundir los archivos de dos maneras diferentes:

1. Para fundir archivos con las mismas variables casos diferentes abra uno de los

archivos de datos. Los casos de este archivo aparecern primero en el nuevo archivo de datos fusionado. Elija en los mens: Datos Fundir archivos Aadir casos. Aparecer automticamente una ventana (Figura2.9) Figura 2.9. Aadir casos en uno de los archivo de datos.

23 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Seleccione Examinar y busque el archivo de dato que desea fundir u selecciona Examinar, Continuar, le aparecer una ventana Aadir casos (Figura 2.10). Figura 2.10. Cuadro de dilogo Aadir casos.

Al aparecer esta ventana podr eliminar las variables que no desea incluir de la lista variables en el nuevo archivo de datos. Aada parejas de variables de la lista de variables desemparejadas que representa la misma informacin registrada con nombres diferentes en los dos archivos. Por ejemplo: el salario de un obrero podra tener el nombre de la variable Salobrer en un archivo y salario en el otro. Para seleccionar una pareja de variables desemparejadas puede enviarlas a variables del nuevo conjunto de datos activos y selecciona Aceptar. En resumen, aadir caso fusiona el archivo de datos de trabajo con otro archivo de datos que contiene las mismas variables pero diferentes casos. Las variables desemparejadas se deben a lo siguiente: Las variables definidas como datos numricos en un archivo y como datos de cadena en el otro (las variables numricas no pueden fusionarse con variables de cadena), Variables de cadenas de longitud diferentes (la longitud definida de una variable de cadena debe ser la misma en ambos archivos de datos). 2. Fundir archivos con los mismos casos pero variables diferentes (columnas). Se debe considerar lo siguiente: Los casos deben estar ordenados de la misma manera en ambos conjuntos de datos.

24 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

Si se utilizan una o ms variables clave para emparejar los casos, los dos conjuntos de datos deben estar ordenados por orden ascendente de la variable o variables clave. Los nombres de las variables del segundo archivo de datos que son duplicados de los del conjunto de datos activo se excluyen por defecto, abra uno de los archivos de datos activo se excluyen por defecto, ya que aadir variables supone que estas variables contienen informacin duplicada. Elija en los mens: Datos Fundir archivos Aadir variables. Aparecer automticamente una ventana (Figura2.11)

Figura 2.11. Aadir variables en uno de los archivo de datos.

Seleccione el conjunto de datos o el archivo de datos IBM SPSS Statistics que va a fusionar con el conjunto de datos activo. Para seleccionar variables claves, elija las variables entre las variables del archivo externo (marcados por el signo +) en la lista de variables excluidas (Figura 2.10) Figura 2.12. Cuadro de dilogo Aadir variables.

25 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

Seleccione Emparejar los casos en las variables clave para los archivos ordenados. Aada las variables a la lista Variables clave. Las variables clave deben existir en el conjunto de datos activo y en el otro conjunto de datos. Ambos conjuntos de datos deben estar ordenados segn el orden ascendente de las variables clave y el orden de las variables de la lista Variables clave debe ser igual a su secuencia de ordenacin. 2.3.3 Agregar datos (casos): Agregar datos consiste en agrupar varios casos en uno solo. La opcin Agregar crea un nuevo archivo de datos en el que cada nuevo caso representa a un conjunto de casos del archivo de datos original. Un archivo agregado tiene, por tanto, menos casos que el archivo original. Para comprender en qu consiste agregar datos es necesario que definamos: Variables de segmentacin: Los casos del archivo original son agrupados a partir de los niveles de una o ms variables de segmentacin. Cada combinacin nica de valores de variables de segmentacin define un grupo. La variable de segmentacin, puede ser tanto numrica como de cadena.

26 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Agregar variables. Las variables del nuevo archivo se obtienen a partir de variables del archivo original. El nombre de la variable agregada viene seguido de una etiqueta de variable opcional. Para agregar casos: Seleccione Datos Agregar Automticamente le aparecer una ventana (Figura 2.13) Figura 2.13. Cuadro de dilogo agregar datos.

Puede seleccionar una o ms variables de segmentacin que definan cmo deben agruparse los casos para crear datos agregados. En la figura 2.13, se ubico una variable de segmentacin de tipo numrico Sexo, lo que significa que todos 27 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


los entrevistados que tengan el mismo Sexo pasaran a formar un nico caso en el nuevo archivo de datos agregados. En la figura hemos decidido que el nuevo archivo contenga una variable: Salario (el nombre es automticamente asignado por el IBM SPSS Statistics 20.). Seleccione una funcin de agregacin para cada variable agregada.

Figura 2.14. Funciones de agregacin.

La variable Salario (figura 2.13), ser el resultado de obtener, para cada nuevo caso agregado, el promedio de los salarios en todos los casos de cada segmento definido por el Sexo. Nombre y etiquetas (opcional). Las nuevas variables son nombradas, por defecto, P10_n ,si se desea cambiar el nombre asignado por defecto: Pulsar el botn Nombre y etiquetas... para acceder al cuadro de dialogo Agregar datos: Nombre y etiqueta de variable que muestra la figura 2.15.

28 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 2.15. Nombre y etiqueta de la variable agregada.

Guardar el resultado agregado: 1. Aadir las variables agregadas al conjunto de datos activo. Las nuevas variables basadas en las funciones de agregacin se aaden al conjunto de datos activo. El propio archivo de datos no se agrega. Cada caso con los mismos valores de variables de segmentacin recibe los mismos valores para las nuevas variables agregadas. 2. Crear un nuevo conjunto de datos que contenga nicamente las variables agregadas. Guarda los datos agregados en un nuevo conjunto de datos durante la sesin actual. El conjunto de datos incluye las variables de segmentacin que definen los casos agregados y todas las variables de agregacin definidas por las funciones de agregacin. No afecta al conjunto de datos activo. 3. Escribir un nuevo archivo de datos que contenga slo las variables agregadas. Guarda los datos agregados en un archivo de datos externo. El archivo incluye las variables de segmentacin que definen los casos agregados y todas las variables agregadas definidas por las funciones de agregacin. No afecta al conjunto de datos activo. Opciones de ordenacin para archivos de datos grandes En el caso de los archivos de datos muy grandes, puede resultar ms eficiente agregar datos ordenados previamente. El archivo ya est ordenado por las variables de segmentacin. Si los datos ya se han ordenados por los valores de las variables de segmentacin, e procedimiento se ejecuta ejecucin ms rpidamente y utiliza menos memoria. Utilice esta opcin con precaucin. Los datos se deben ordenar por valores de variables de segmentacin en el mismo orden que las variables de segmentacin especificadas para el procedimiento Agregar datos. Si va a aadir variables al conjunto de datos activo, seleccione slo esta opcin si los datos se han ordenado mediante valores ascendentes de las variables de segmentacin. 29 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Ordenar el archivo antes de la agregacin. En situaciones muy extraas y con archivos de datos voluminosos, puede ser necesario ordenar el archivo de datos por los valores de las variables de segmentacin antes de realizar la agregacin. No se recomienda esta opcin a menos que se presenten problemas de memoria y/o rendimiento. 2.3.4 Segmentar archivos: Segmentar archivo divide el archivo de datos en distintos grupos para el anlisis basndose en los valores de una o ms variables de agrupacin. Si selecciona varias variables de agrupacin, los casos se agruparn por variable dentro de las categoras de la variable anterior de la lista Grupos basados en. Por ejemplo, si selecciona sexo como la primera variable de agrupacin y Edad como la segunda, los casos se agruparn por la Edad dentro de cada categora de sexo. Es posible especificar hasta ocho variables de agrupacin (Figura 2.16). Figura 2.16. Cuadro de dilogo para segmentar archivo.

Los casos deben ordenarse segn los valores de las variables de agrupacin, en el mismo orden en que aparecen las variables en la lista Grupos basados en. Si el archivo de datos todava no est ordenado, seleccione Ordenar archivo segn variable de agrupacin. Los grupos de segmentacin del archivo se presentan juntos para poder compararlos a travs del botn Comparar los grupos (Figura 2.16). Los grupos de segmentacin del archivo se presentan juntos para poder compararlos. Para las tablas pivote se crea una sola tabla y cada variable de segmentacin del archivo puede desplazarse entre las dimensiones de la tabla. En el caso de los grficos se crea un grfico diferente para cada grupo y se muestran juntos en el Visor. El resultado de cada procedimiento se 30 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

muestra por separado para cada grupo de segmentacin del archivo si se selecciona el botn Organizar los resultados por grupos.

Para segmentar un archivo de datos para el anlisis Elija en los mens: Datos Segmentar archivo... Seleccione Comparar los grupos u Organizar los resultados por grupos. Seleccione una o ms variables de agrupacin.

2.3.5 Seleccin de casos. En ocasiones puede interesar centrar el Anlisis en solo un grupo de casos que cumplan determinada condicin. En otras ocasiones puede que solo interese analizar una muestra aleatoria del total de casos del archivo de datos. IBM SPSS Statistics, permite seleccionar un conjunto de casos utilizando diferentes criterios: Seleccin de una muestra aleatoria de casos, seleccin de los casos que cumplen con una determinada condicin, seleccin de un nmero determinado de casos. La seleccin de casos es una opcin a la que todo usuario termina encontrando gran utilidad. Para seleccionar casos: Seleccione en los mens: Datos Seleccionar casos. (Figura 2.17)

31 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 2.17 Seleccionar casos.

Se observa que por defecto estn seleccionados todos los casos, es decir los anlisis se realizarn utilizando todos los casos. 1. Si se satisface la condicin. Cuando se desee seleccionar aquellos casos que satisfagan una determinada condicin lgica se activar esta opcin seleccionando el botn Si... para especificar la condicin. Si el resultado de la expresin condicional es verdadero, se selecciona el caso. Si el resultado es falso o perdido, no se selecciona el caso (Figura 2.18) Figura 2.18. Ventana de seleccin de casos si se satisface la condicin.

32 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


2. Muestra aleatoria de casos. Selecciona una muestra aleatoria basndose en un porcentaje aproximado o en un nmero exacto de casos (Figura 2.19). Figura 2.19. Seleccin de casos con la opcin muestra aleatoria de casos.

Con la opcin Aproximadamente se especifica el porcentaje de casos que se quieren seleccionar. Con la opcin Exactamente se especifica el nmero de casos que se quieren seleccionar. 3. Basndose en el rango del tiempo o de los casos. Selecciona los casos basndose en un rango de los nmeros de caso o en un rango de las fechas/horas (Figura 2.20). Los rangos de casos se basan en el nmero de filas que se muestra en la vista de datos. Figura 2.20 Seleccin de casos basados en rango.

4. Usar variable de filtro. Utiliza como variable para el filtrado la variable numrica seleccionada del archivo de datos. Se seleccionan los casos con cualquier valor distinto del 0 o del valor perdido para la variable seleccionada. Por ejemplo; Si la variable Sexo es una variable que en la vista de variable tiene valores : 1 = Femenino , 2 = Masculino y se desea seleccionar nicamente Femenino que toma el valor de 1 en la variable utilizada como filtro y no entraran en el anlisis los casos que tomen valor de 2 en dicha variable ( Figura 2.21)

33 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 2.21. Conjunto de datos filtrados por la variable sexo Femenino.

Observe que los casos no seleccionados se marcan con una lnea diagonal en la vista de datos. Especifique los criterios de seleccin de casos (Resultado) Esta seccin controla el tratamiento de casos no seleccionados. Puede elegir una de las siguientes alternativas para tratar los casos no seleccionados: 1. Descartar casos no seleccionados. Los casos no seleccionados no se incluyen en el anlisis, pero se conservan en el conjunto de datos. Podr utilizar los casos no seleccionados ms adelante en la sesin, si desactiva el filtrado. Si selecciona una muestra aleatoria o si selecciona los casos mediante una expresin condicional, se generar una variable con el nombre filter_$ que tendr el valor 1 para los casos seleccionados y el valor 2 para los casos no seleccionados. 2. Copiar casos seleccionados a seleccionados se copiarn a un inalterado el conjunto de datos incluirn en el nuevo conjunto de el conjunto de datos original. un nuevo conjunto de datos. Los casos nuevo conjunto de datos, lo que mantendr original. Los casos no seleccionados no se datos y se mantendrn en su estado original en

3. Eliminar casos no seleccionados. Los casos no seleccionados se eliminarn del conjunto de datos. Slo se pueden recuperar los casos eliminados saliendo del archivo sin guardar ningn cambio y abrindolo de nuevo. La eliminacin de los casos ser permanente si se guardan los cambios en el archivo de datos. Si elimina los casos no seleccionados y guarda el archivo, no ser posible recuperar estos casos. 34 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


2.3.6 Creacin de nuevas variables. La creacin de nuevas variables se origina a partir de funciones aritmticas, funciones estadsticas, funciones de distribucin. Para crear una variable seleccione en el men Transformar, y dentro de este se selecciona la opcin Calcular, aparecer una venta (figura 2.22). Figura 2.22. Cuadro de dilogo para Calcular variable.

Variable de destino: se especifica el nombre que se va a dar a la nueva variable. Expresin numrica: se especifica la expresin aritmtica o lgica que se va a evaluar. Esta expresin puede contener operadores aritmticos, operadores lgicos o una de las funciones que aparecen en la lista que figura debajo de este campo. Esta lista contiene funciones aritmticas, funciones estadsticas, funciones referentes a valores missing, funciones de distribucin y funciones temporales. Las constantes de cadenas deben ir entre comillas o apstrofes. Si no se selecciona casos opcionales, la nueva variable se calculara para todos los casos y se aadir al final de la vista datos. (Figura 2.23).

35 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 2.23 Ventana de datos con la nueva variable Costo1.

A veces es necesario calcular la nueva variable en un subconjunto de casos seleccionados utilizando expresiones condicionales (Figura 2.24). Figura 2.24. Calcular variable de un subconjunto de casos.

36 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Al plantear esta condicin, la nueva variable ser creada nicamente para los casos que satisfacen dicha condicin (Figura 2.25). Figura 2.25 Ventana de datos con la nueva variable Costo1, para una determinada sub muestra que verifica una condicin.

2.3.7 Conteo de casos. Para realizar el conteo de valores dentro de los casos deber seleccionar en el men Transformar, y dentro de este se selecciona la opcin Contar valores dentro de los casos, aparecer una venta (figura 2.26). Figura 2.26 Ventana de conteo de valores dentro de los casos.

37 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Se debe introducir la variable destino. Luego, seleccione definir valores y especifique los valores que se deben contar (Figura 2.27). Figura 2.27 Definir valores para el conteo de los casos.

Si no se selecciona casos opcionales, el conteo de valores entre los casos se aadir al final de la vista datos. (Figura 2.28). Figura 2.28 Conteo de valores en la vista de datos

38 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Si desea, puede definir un subconjunto de casos en los que contar las apariciones de valores bajo ciertas condiciones. 2.3.8 Recodificacin de variables. Los valores de datos se pueden modificar mediante la recodificacin. Esto es particularmente til para agrupar o combinar categoras. Puede recodificar los valores dentro de las variables existentes o crear variables nuevas que se basen en los valores recodificados de las variables existentes. Recodificacin en la misma variable: El cuadro de dilogo Recodificar en las mismas variables le permite reasignar los valores de las variables existentes o agrupar rangos de valores existentes en nuevos valores. Por ejemplo, podra agrupar los Costos en categoras que sean rangos de Costos. Seleccione el men Transformar, y dentro de este se selecciona la opcin Recodificar en las mismas variables, aparecer una venta (figura 2.29) Figura 2.29. Ventana de dilogo Recodificar en la misma variable.

Seleccione las variables que desee recodificar. Por ejemplo: Costo. Si selecciona mltiples variables, todas debern ser del mismo tipo (numricas o de cadena).Luego, deber seleccionar en Valores antiguos y nuevos y especifique cmo deben recodificarse los valores. (Figura 2.30).

39 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 2.30. Cuadro de dialogo de valores antiguos y nuevos.

Si lo desea, puede definir un subconjunto de los casos para su recodificacin como sigue: Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar valores individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos del sistema no se pueden seleccionar para las variables de cadena, ya que ninguno de los conceptos es aplicable a estas variables. Los rangos incluyen sus puntos finales y los valores definidos como perdidos por el usuario que estn dentro del rango. Valor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser el mismo tipo de datos (numrico o de cadena) que el de las variables que se van recodificar. Perdido por el sistema. Valores asignados por el programa cuando los valores de sus datos no estn definidos de acuerdo al tipo de formato que haya especificado, cuando un campo numrico est vaco, o cuando no est definido un valor como resultado de un comando de transformacin. Los valores numricos perdidos del sistema se muestran como puntos. Las variables de cadena no pueden tener valores perdidos del sistema, ya que es lcito cualquier carcter en las variables de cadena. Perdido por el sistema o usuario. Observaciones que tienen valores que el usuario ha declarado perdidos o que son desconocidos y se les ha asignado el valor perdido del sistema, lo que se indica mediante un punto (.). 40 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Rango. Rango inclusivo de valores. No disponible para variables de cadena. Se incluir cualquier valor perdido por el usuario dentro del rango. Todos los dems valores. Cualquier valor no incluido en una de las especificaciones de la lista Antiguo->Nuevo. Aparece en la lista Antiguo->Nuevo como ELSE. Una vez que seleccione la manera de cmo va a recodificar a la variable selecciona Continuar y Aceptar. Automticamente en la vista de datos aparece la nueva recodificacin de la variable con etiqueta de valor lo cual esta se deber de definir en la vista de variables (Figura 2.31). Figura 2.31. Etiqueta de valor de la nueva variable recodificada.

Selecciona aceptar y en la vista de datos aparecern los nuevos valores para la variable Costo, definida en rangos. La recodificacin en una misma variable es un poco inusual ya que una vez creada la nueva variable no se podr recuperar la base de datos original. Recodificacin en distinta variable. El cuadro de dilogo Recodificar en distintas variables le permite reasignar los valores de las variables existentes o agrupar rangos de valores existentes en nuevos valores para una variable nueva. Por ejemplo, podra agrupar los Costos en una nueva variable que contenga categoras de rangos de Costos. Seleccione el men Transformar, y dentro de este se selecciona la opcin Recodificar en distintas variables, aparecer una venta (figura 2.32)

41 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 2.32. Ventana de dilogo Recodificar en distinta variable.

Seleccione las variables que desee recodificar. Por ejemplo: Costo. Introduzca el nombre y etiqueta de la nueva variable, seleccione cambiar. Luego, deber seleccionar en Valores antiguos y nuevos y especifique cmo deben recodificarse los valores. (Figura 2.30). Una vez que seleccione la manera de cmo va a recodificar a la variable selecciona Continuar y Aceptar. Automticamente en la vista de dato s aparece la nueva recodificacin de la variable con etiqueta de valor lo cual esta se deber de definir en la vista de variables (Figura 2.31). Selecciona aceptar y en la vista de datos aparecern los nuevos valores para la variable Costo1, definida en rangos (Figura 2.32). Figura 2.32. Vista de variable con la variable Costo1.

42 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


CAPTULO 3. Anlisis Exploratorio de Datos.
3.1 Anlisis exploratorio de datos. Procedimiento Explorar. El software IBM SPSS Statistics permite realizar anlisis exploratorio completo de datos (Visual y formal) a travs del procedimiento Explorar, que genera estadsticos de resumen y representaciones grficas, bien para todos los casos o de forma separada para grupos de casos. Existen numerosas razones para utilizar este procedimiento: para inspeccionar los datos, obtener descripciones, comprobar supuestos y caracterizar diferencias entre sub poblaciones (grupos de casos). La inspeccin de los datos puede mostrar que existen valores inusuales, valores extremos, discontinuidades en los datos u otras peculiaridades. La exploracin de los datos puede ayudar a determinar si son adecuadas las tcnicas estadsticas que est teniendo en consideracin para el anlisis de los datos. La exploracin puede indicar que necesita transformar los datos si la tcnica necesita una distribucin normal. O bien, el usuario puede decidir que necesita utilizar pruebas no paramtricas. Para explorar los datos en los mens, seleccione: Analizar Estadsticos descriptivos Explorar... (Figura 3.1) Figura 3.1 Cuadro de dilogo explorar.

Seleccione una o ms variables dependientes. Si lo desea, puede: - Seleccionar una o ms variables de factor, cuyos valores definirn grupos de casos. - Seleccionar una variable de identificacin para etiquetar los casos. 43 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


- Pulse en Estadsticos para obtener estimadores robusto, percentiles y tablas de frecuencias. - Pulse en Grficos para obtener histogramas, pruebas y grficos de probabilidad normal y diagramas de dispersin por nivel con estadsticos de Levene.

- Pulse en Opciones para manipular los valores ausentes. Aceptar. 3.2 Diagramas de Cajas. El diagrama de caja y bigotes permite analizar y resumir a un conjunto de datos univariante dado. Esta herramienta de anlisis exploratorio de datos va a permitir estudiar la simetra de los datos, detectar valores atpicos (Observaciones aisladas cuando el comportamiento se diferencia claramente del comportamiento medio del resto de las observaciones). El grfico de caja y bigotes divide los datos en cuatro reas de igual frecuencia, una caja central divide en dos reas por una lnea horizontal y otras dos reas representadas por dos segmentos verticales (Bigotes) que parten de cada lado horizontal de la caja. La mediana es la lnea horizontal en el interior de la caja, si esta lnea esta en el centro no hay asimetra. El sistema considera valores atpicos los que se encuentran a la izquierda del bigote izquierdo a la derecha del bigote derecho, mediante puntos alineados con la lnea vertical central para que sean fciles de detectar. Para obtener un diagrama de caja seleccione en el men: Grficos Cuadro de dilogo antiguo Diagramas de caja y elija simple y resmenes para distintas variables (Figura3.2). Figura 3.2 Cuadro de dilogo Diagrama de caja para distintas variables.

44 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Al seleccionar Definir se obtiene la figura 3.3, en la que elije la variable motor para representar en cajas. Luego, pulse Aceptar. Figura 3.3 Cuadro de dilogo Definir diagrama de caja Simple, para distintas variables.

Para obtener diagramas de caja cuando existe una variable dependiente y un nivel de categora. Seleccione en el men: Grficos Cuadro de dilogo antiguo Diagramas de caja y elija simple y resmenes para grupos de datos (Figura 3.4). Al seleccionar Definir se obtiene la figura 3.5, en la que elije la variable motor para representar en cajas y como eje de categora origen. Luego, pulse Aceptar Figura 3.4 Cuadro de dilogo Diagrama caja para grupos de casos. Figura 3.5. Cuadro de dilogo Definir Diagrama de caja con eje de categoras.

45 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


CAPTULO 4. Descripcin Estadstica de una variable.
4.1 Datos y distribucin de frecuencias Datos: Es aquel que se obtiene mediante un proceso que comprende la observacin o medicin. Un conjunto de datos debe cumplir las normas de denominacin de variables. Distribucin de frecuencia: Es un agrupamiento de datos en categoras que muestra el numero de observaciones en un estudio. En IMB SPSS Statistics, en el men Analizar Estadsticos descriptivos Frecuencia, permite obtener distribuciones de frecue ncias, representaciones grficas de dichas distribuciones, y los estadsticos descriptivos ms utilizados. Figura 4.1 Cuadro de dilogo de frecuencia

Con las opciones de Estadsticos se solicitan los estadsticos descriptivos para las variables numricas seleccionadas, entonces se obtiene la siguiente ventana: Figura 4.2 Cuadro de dilogo opciones de Estadsticos.

46 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Los estadsticos que se desean obtener; observemos que por defecto no est seleccionado ningn estadstico. Si se seleccionan los Cuartiles, muestra los valores correspondientes a los percentiles 25, 50 y 75. Los Puntos de corte son los valores que dividen los casos en un nmero de grupos del mismo tamao. Despus de seleccionar esta opcin, introduzca un entero positivo, entre 2 y 100, para especificar el n de grupos de igual tamao que desea obtener. Por ltimo, si se selecciona la opcin Percentil(es), hay que introducir un valor de percentil entre 0 y 100 y pulsar en el botn de Aadir La opcin Grficos son opcional estos los analizaremos ms adelante. Si desea cambiar el formato de la tabla selecciona Formato y aparecer una ventana (Figura 4.3) Figura 4.3Cuadro de dilogo de frecuencia Formato.

Observemos que por defecto, el programa ordena de forma ascendente los resultados segn los valores que toma la variable a analizar. Si se quiere ordenar de forma descendente, se selecciona la opcin Valores descendentes. Si se desea ordenar la tabla de frecuencias resultante segn los valores de las frecuencias, en vez de por los valores de las variables, se seleccionan la opcin Frecuencias ascendentes o Frecuencias descendentes. Interpretacin de resultados a partir de la tabla de distribucin de frecuencia. 1. Supngase que se desea analizar la distribucin de frecuencia de la variab le Sexo, entonces se obtiene al seleccionar la barra de men (Figura 4.1), donde obtendremos la tabla de frecuencias en la ventana de resultados.

En la tabla de frecuencia se tiene como resultado:

47 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Los distintos valores que toma la variable SEXO. Frecuencia absoluta Frecuencia relativa porcentual. Porcentaje de valores vlidos, coincide con el porcentaje anterior porque esta variable no tiene valores missing. Porcentaje acumulado. 4.2 Diagrama tallo y hojas El diagrama de tallo y hoja es un procedimiento semigrfico para presentar la informacin para variables cuantitativas, que es especialmente til cuando el nmero total de datos es pequeo (menor que 50). El diagrama de tallo y hojas, tambin llamado histograma digital, es una combinacin entre un histograma de barra y una tabla de frecuencias. Al mantener los valores de la variable, el diagrama tallo y hoja resulta ms informativo que el clsico histograma de barras, ya que conserva los datos originales y al mismo tiempo, compone un perfil que ayuda a estudiar la forma y simetra de la distribucin. Adems, muestra el rango de los datos. Para obtener el diagrama tallo y hojas seleccione el men: Analizar Estadsticos descriptivos Explorar Grfico y seleccione en Descriptivos en tallos y hojas Continuar visualizacin seleccione Aceptar (grfica 4.4). Grfico 4.4 Diagrama tallo y hojas de la Variable Costo en Base ejemplo 1 . Costo Stem-and-Leaf Plot Frequency Stem & Leaf 6.00 0. 000234 10.00 0 . 5555567777 4.00 1 . 1223 3.00 1 . 579 1.00 2. 2 1.00 Extremes (>=550) Stem width: 100.0 Each leaf: 1 case(s) 4.3 Representaciones grficas Para realizar algn tipo de grfica, seleccione el men Grficos Grficos, se abre automt icamente una ventana (Figura 4.5) Generador de

48 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 4.5 Cuadro de dilogo Generador de grficos.

En la lista Elija entre, seleccione una categora de grficos. Cada categora ofrece varios tipos. Luego, Arrastre la imagen del grfico deseado al lienzo. Tambin puede pulsar dos veces en la imagen. Si en el lienzo ya aparece un grfico, el grfico de la galera sustituir al conjunto de ejes y a los elementos grficos del grfico. Arrastre variables desde la lista Variables y colquelas en las zonas de colocacin del eje Y, si est disponible, en la zona de colocacin de agrupamiento. Si una zona de colocacin del eje ya muestra un estadstico que desea utilizar, no tendr que arrastrar ninguna variable a la zona de colocacin. Slo deber aadir una variable a la zona cuando el texto de la zona sea azul. Si el texto es negro, la zona ya contiene una variable o un estadstico.

49 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 4.6 Cuadro de dilogo Generador de grfico.

Si necesita cambiar los estadsticos o modificar los atributos de los ejes o las leyendas (como la amplitud de la escala), pulse en Propiedades del elemento. Figura 4.7 Cuadro de dilogo Propiedades del elemento.

50 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


En la lista Editar propiedades de, seleccione el elemento que desea cambiar. (Si desea obtener informacin acerca de propiedades especficas, pulse en Ayuda.) Una vez realizados los cambios, pulse en Aplicar. Si necesita agregar ms variables al grfico (por ejemplo, para la agrupacin o la adicin de paneles), pulse en la pestaa Grupos/ID de puntos del cuadro de dilogo Generador de grficos y seleccione una o ms opciones. A continuacin, arrastre las variables categricas a las nuevas zonas de colocacin que aparecen en el lienzo. Si desea transponer el grfico (por ejemplo, para que las barras sean horizontales), pulse en la pestaa Elementos bsicos y, a continuacin, pulse en Transponer. Pulse en Aceptar para crear el grfico. Aparecer el grfico en el Visor ( Figura 4.8) Figura 4.8 Grfico sectorial (Pastel) en la ventana visor.

Pude Editar el grficos para que pueda personalizar sus grficos y explorar los datos de la siguiente manera: Puede crear un grfico en IBM SPSS Statistics o abrir un archivo con grficos del Visor. Pulse dos veces en un grfico del Visor. Pulse dos veces en elemento grfico o Seleccionar un elemento grfico y elija a continuacin en los mens: Edicin Propiedades. Adems, el cuadro de dilogo Propiedades aparece automticamente al aadir un elemento al grfico.

El cuadro de dilogo Propiedades incluye una serie de pestaas que le permiten definir las opciones y realizar otros cambios en el grfico. Las pestaas que puede ver en el cuadro de dilogo Propiedades se basan en la seleccin actual. Dilogo de Propiedad para la grfica. Para cualquier cambio que realice en la grafica seleccione Aplicar. 51 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


4.4 Caractersticas de una distribucin La curtosis y la asimetra son los estadsticos que caracterizan la forma y simetra de la distribucin. Estos estadsticos se muestran con sus errores tpicos. - Curtosis. Medida del grado en que las observaciones estn agrupadas en torno al punto central. Para una distribucin normal, el valor del estadstico de curtosis es 0. Una curtosis positiva indica que las observaciones se concentran ms y presentan colas ms largas que las de una distribucin normal. Una curtosis negativa indica que las observaciones se agrupan menos y presentan colas ms cortas. - Asimetra. Medida de la asimetra de una distribucin La distribucin normal es simtrica y tiene un valor de asimetra igual a 0. Una distribucin que tenga una asimetra positiva significativa tiene una cola derecha larga. Una distribucin que tenga una asimetra negativa significativa tiene una cola izquierda larga. Como regla aproximada, un valor de la asimetra mayor que el doble de su error tpico se asume que indica una desviacin de la simetra. - Orden de presentacin. Por defecto, las variables se muestran en el orden en que se hayan seleccionado. Si lo desea, se pueden mostrar las variables alfabticamente, por medias ascendentes o por medias descendentes. Para encontrar las caractersticas de la distribucin, seleccione: Analizar Estadsticos descriptivos Frecuencia Estadsticos (Seleccionar Distribucin) Continuar Aceptar (Figura 4.9) Tabla 2. Caractersticas de la distribucin de la variable Costo Base de datos Ejemplo1.

En la tabla de estadsticos caractersticas de la distribucin de la variable Costo, se tienen los siguientes resultados: N, valores validos, se refiere al total de casos en la ventana de datos. No hay valores Missing. 52 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Asimetra Error estndar de asimetra. Curtosis Error estndar de curtosis.

4.5 Medidas de Tendencia Central. En el estudio de estadsticos univariados se disponen de las medidas de tendencia central tales como; Media aritmtica. Mediana. Moda. Nota: Estas medidas se pueden calcular nicamente para variables cuantitativas y cuando los casos (datos) no se encuentran agrupados por intervalos. - Supongamos que deseamos calcular y analizar las medidas de tendencia central de la variable Costo, se selecciona el men Analizar Estadsticos descriptivos Frecuencia, se ubica la variable Costo y se selecciona Estadsticos y con el mouse seleccione las medidas de tendencia central. Luego, seleccione Continuar y Aceptar. En la ventana de resultado aparecer una tabla con los estadsticos solicitada (Tabla 2. Estadsticos de tendencia central) Tabla2. Estadsticos de tendencia central de la variable Costo.

En la tabla de estadsticos de tendencia central se tienen los siguientes resultados: N, valores validos, se refiere al total de casos en la ventana de datos. No hay valores Missing. Media Mediana Moda

4.6 Medidas de dispersin y su uso. En el estudio de estadsticos univariados se disponen de las medidas de variabilidad o dispersin tales como; Valor mximo. Valor mnimo. 53 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Rango. Varianza. Desviacin Estndar. Error estndar de la media. Nota: Estas medidas se pueden calcular nicamente para variables cuantitativas y cuando los casos (datos) no se encuentran agrupados por intervalos. - Supongamos que deseamos calcular y analizar las medidas de dispersin de la variable Costo, se selecciona el men Analizar Estadsticos descriptivos Frecuencia, se ubica la variable Costo y se selecciona Estadsticos y con el mouse seleccione las medidas de dispersin. Luego, seleccione Continuar y Aceptar. En la ventana de resultado aparecer una tabla con los estadsticos solicitada (Tabla 3. Estadsticos de dispersin) Tabla 3. Estadsticos de dispersin para la variable Costo.

En la tabla de estadsticos de dispersin se tienen los siguientes resultados: N, valores validos, se refiere al total de casos en la ventana de datos. No hay valores Missing. Error estndar de la media. Desviacin estndar. Varianza. Rango. Valor mnimo. Valor mximo.

54 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

CAPTULO 5. Descripcin conjunta de dos variables categricas.


5.1 Tablas de contingencia El procedimiento Tablas de contingencia crea tablas de clasificacin doble y mltiple y, adems, proporciona una serie de pruebas y medidas de asociacin para las tablas de doble clasificacin. La estructura de la tabla y el hecho de que las categoras estn ordenadas o no determinan las pruebas o medidas que se utilizaban. Los estadsticos de tablas de contingencia y las medidas de asociacin slo se calculan para las tablas de doble clasificacin. Si especifica una fila, una columna, el procedimiento tablas de contingencia crea un panel de medidas y estadsticos asociados para cada valor del factor o una combinacin de valores para dos o ms variables de control. Para la creacin de la tabla de contingencia seleccione el men: Analizar Estadsticos descriptivos Tablas de contingencia... (Grfico 5.1) Grfico 5.1 Cuadro de dilogo de Tablas de contingencia

. Seleccione una o ms variables de fila y una o ms variables de columna. Seleccionar una o ms variables de control. 55 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Pulsar en Casillas para obtener porcentajes, residuos y valores esperados y observados ( Figura 5.2)

Figura 5.2 Cuadro de dilogo Mostrar en las casillas

Recuentos. El nmero de casos realmente observados y el nmero de casos esperados si las variables de fila y columna son independientes entre s. Porcentajes. Los porcentajes se pueden sumar a travs de las filas o a lo largo de las columnas. Tambin se encuentran disponibles los porcentajes del nmero total de casos representados en la tabla (una capa). Residuos. Los residuos brutos no tipificados presentan la diferencia entre los valores observados y los esperados. Tambin se encuentran disponibles los residuos tipificados y tipificados corregidos. No tipificados. Diferencia entre el valor observado y el valor esperado. El valor pronosticado es el nmero de casos que se esperara encontrar en la casilla si no hubiera relacin entre las dos variables. Un residuo positivo indica que hay ms casos en la casilla de los que habra en ella si las variables de fila y columna fueran independientes. Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1. Tipificados corregidos. El residuo de una casilla (el valor observado menos el valor

56 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Pronosticado) dividido por una estimacin de su error tpico. El residuo tipificado resultante viene expresado en unidades de desviacin tpica, por encima o por debajo de la media. - Pulsar en Formato para controlar el orden de las categoras. 5.2 Test Chi Cuadrado. El Test Chi_ Cuadrado ( ) es una prueba estadstica no paramtrica para diferencias entre dos o ms muestras donde frecuencias esperadas son comparadas en relacin con frecuencias obtenidas.
2

Prueba No Paramtrica: procedimiento estadstico que no adopta ningn supuesto acerca de cmo se distribuye la caracterstica bajo estudio en la poblacin, y que slo requiere datos nominales u ordinales. Estas medidas son importantes porque la mayora de la informacin en la investigacin social y administrativa es de carcter nominal u ordinal, y porque no siempre estamos seguros que la caracterstica que deseamos estudiar se distribuye normalmente en la poblacin.

2 Se utiliza para hacer comparaciones entre frecuencias y no entre valores medios. 2 La de Pearson se emplea para comprobar la independencia de variables aleatorias.
Para hacer uso del Test Chi_ Cuadrado, seleccione el men: Analizar Estadsticos descriptivos Tablas de contingencia... (Grfico 5.3) Grfico 5.3. Cuadro de dilogo Tabla de contingencia para el anlisis de la chi- cuadrada.

57 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.

Seleccione una o ms variables de fila y una o ms variables de columna. Seleccionar una o ms variables de control. Pulsar en Estadsticos y seleccione Chi _cuadrado ( Figura 5.4)

Figura 5.4 Cuadro de dilogo de Estadstico.

Continuar. Aceptar. 58

Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Por ejemplo; Se desea saber si El salario y Nivel acadmico son independiente, se efecta el anlisis de la chi_ cuadrado se obtiene la siguiente tabla 4. Tabla 4. Estadstico Chi_ Cuadrado.

En la tabla de estadsticos Chi _Cuadrado se tienen los siguientes resultados: Chi_ Cuadrado de Pearson. Razn de verosimilitud. Asociacin lineal por lineal. N de casos vlidos.
2

El valor (muestral) del estadstico es 2651.149a; los grados de libertad (gl) son 1980, que es el resultado de la siguiente multiplicacin: (nmero de filas1)(nmero de columnas-1); y el p-valor o nivel crtico (Sig. asint. bilateral) es 0.000 (menor que el habitual nivel de significacin, = 0.05), por lo que deberamos rechazar la hiptesis nula de independencia de las variables El salario y Nivel acadmico. 5.3 Comparacin de Medias. El procedimiento Medias, calcula medias de subgrupo y estadsticos univariados relacionados para variables dependientes dentro de las categoras de una o ms variables independientes. Para obtener medias de subgrupo En los mens, seleccione: - Analizar Comparar medias Medias... (Figura 5.5)

59 Lic. Martha Sevilla

Anlisis Estadstico de Datos con SPSS.


Figura 5.5 Cuadro de dilogo Medias.

- Seleccione una o ms variables dependientes. - Utilice uno de los siguientes mtodos para seleccionar variables independientes categricas: Seleccione una o ms variables independientes. Se mostrarn resultados individuales para cada variable independiente. Seleccione una o ms capas de variables independientes. Cada capa subdivide consecutivamente la muestra. Si tiene una variable independiente en Capa 1 y otra variable independiente en Capa 2, los resultados se mostrarn en una tabla cruzada en contraposicin atablas individuales para cada variable independiente. Si lo desea, pulse en Opciones si desea obtener estadsticos opcionales, una tabla de anlisis de varianza, eta, eta cuadrado, R, y R2. Tabla de Anova y eta. Muestra una tabla de anlisis de varianza de un factor y calcula la eta y la eta cuadrado (medidas de asociacin) para cada variable independiente de la primera capa. Contrastes de linealidad. Calcula la suma de cuadrados, los grados de libertad y la media cuadrtica asociados a los componentes lineal y no lineal, as como la razn F, la R y la R cuadrado. Si la variable independiente es una cadena corta entonces la linealidad no se calcula.

60 Lic. Martha Sevilla