CURSO DE SPSS

SPSS I . - INTRODUCCIÓN AL SPSS
1.- MENU PRINCIPAL .- La versión del SPSS que estudiaremos es la 12.0,
en ella se puede observar un menú principal que la podemos describir de la siguiente manera: Archivo. Edición. Mediante este menú se pueden abrir, crear o grabar los diferentes ficheros que SPSS emplea. Igualmente, es posible controlar las tareas de impresión. Permite realizar las tareas habituales de edición: modificar, borrar, copiar, pegar, seleccionar etc. Ver. Permite controlar diversos parámetros de visualización en pantalla. datos: seleccionar, añadir, ponderar, etc. Transformar.

Datos. Este menú permite definir variables, así como efectuar modificaciones en los ficheros de

Aquí se encuentran todas las opciones relativas a la modificación y generación
de nuevas variables. Las funciones de este menú y del anterior son temporales, y solo están vigentes durante la sesión, sin que afecten al fichero original de datos.

Analizar. Gráficos. Utilidades.

Mediante este menú se accede a los diferentes análisis estadísticos que se hayan instalado. Permite la creación y edición de diversos tipos de gráficos de alta resolución. Entre otras, posibilita mostrar información sobre los ficheros de SPSS, las variables o el tratamiento de conjuntos de variables. Dispone de las funciones habituales para controlar las ventanas. Proporciona ayuda al usuario en el formato típico de Windows.

Ventana ?

Lic. RAUL RUIZ ARIAS

1

CURSO DE SPSS

2.- Para grabar un archivo de datos
Paso 1: Ir al menú principal y seleccionar “Archivo” Paso 2 : Seleccionar “Guardar como”

Paso 3. Encontramos el siguiente cuadro:

• •

Guardar en .- podemos seleccionar en que carpeta grabaremos el archivo de datos (debemos crear la carpeta “trabajo” donde guardaremos nuestros archivos) Nombre.- En este cuadro ingresaremos el nombre del archivo de datos.

Paso 4 : Presionar el botón “Guardar”. Observaciones • Se debe tener cuidado de no tener otro archivo con el mismo nombre. Si el archivo ya fue grabado anteriormente, no es necesario ir a la opción “grabar como” , en este caso seleccionar el botón “grabar”, y los cambios que hemos realizado se grabaran en este archivo.

• •

En la barra de herramienta, una forma rápida de grabar, si el archivo ya existe, es presionar en el icono: Cuando se trabaja con el SPSS, se genera un archivo que contienen los resultados de las operaciones realizadas, estos archivos se conocen como “Output”, el procedimiento para grabarlos es similar a los archivos de datos.

Lic. RAUL RUIZ ARIAS

2

1. de forma que la codificación numérica es la que corresponde a las variables cuantitativas. AND.CURSO DE SPSS 3. GE. no se pueden usar como nombres de variables. pero debe iniciar con una letra. Así para las variables numéricas enteras cuyos valores oscilan entre 0 y 20 se puede ingresar: ancho 2 y cifras decimales 0. La extensión máxima de los nombres es de 8 caracteres. 3. EQ. Es indiferente usar mayúsculas o minúsculas.TIPO DE VARIABLES EN SPSS (TYPE) Las variables que configuran una matriz de datos permiten distinguir entre variables cuantitativas y cualitativas. TO. NE. Admite cualquier número. SPSS exige que se asigne un nombre a cada variable con la finalidad de identificar correctamente los diferentes conjuntos de datos. Cadena.. RAUL RUIZ ARIAS 3 . LT. WITH.DEFINICIÓN DE LAS VARIABLES DE LA MATRIZ 1. 4. OR. Hay una serie de palabras claves que tienen un significado especial para SPSS. Su longitud máxima es de 40 caracteres de los cuales 16 pueden ser cifras decimales. Admiten cualquier carácter. Ejemplos: ALL. 2. BY. GT. Le añade el símbolo del dólar en los diferentes formatos que aparecen en la ventana que se despliega caso de elegir esta opción. y la alfanumérica la que mejor se adapta a las cualitativas. 3.. NOT. en su definición debe especificarse únicamente su longitud máxima. Permite formatos para fecha Dólar. LE. y en consecuencia. Fecha. Lic. puede ir precedido del signo más o del menos. Seleccione la primera variable a trabajar y en la esquina inferior izquierda seleccione “Vista de variables”. Al presionar en el botón Tipo obtendrás lo siguiente: Numérica.

al ingresar los datos al SPSS se debe codificar la información para que sea más fácil su análisis.. guardar el archivo con el nombre Ejemplo_1 en nuestra carpeta de trabajo. Hombre. El proceso se repite con todos los valores de la variable que se quieran etiquetar.2. Hombre. se teclea el código del valor de la variable.. se pulsa el botón Añadir. Ejemplo 1 .El siguiente ejemplo nos permitirá observar como se ingresan datos al SPSS. Mujer. Mujer Pasos para ingresar datos al SPSS: Paso 1.. RAUL RUIZ ARIAS 4 .CURSO DE SPSS 3. en este caso Hombre es 1 y mujer es 0. Hombre. Paso 2. con lo que la correspondencia entre el valor y la etiqueta queda incorporada a la lista. Una vez acabado el proceso. Hombre.. Hombre. Asumamos que tenemos el siguiente grupo de personas: Hombre. Mujer.En la opción “Vista de variables” se debe identificar la variable en estudio: Lic. A continuación. Mujer. se pulsa el botón Aceptar. el texto de la etiqueta en el cuadro correspondiente a Etiqueta de valor finalmente..Etiquetas de valor (Valores) En primer lugar. en el cuadro correspondiente a Valor.

.CURSO DE SPSS Nombre de la variable Tipo Ancho Decimales : : : : sexo numérico 2 dígitos sin decimales En la opción “Valores” Nuestro archivo queda de la siguiente manera: Paso 3. RAUL RUIZ ARIAS 5 .Que pasa si nos interesa resumir nuestra información? En el menú principal: Analizar => Estadísticos descriptivos => Frecuencias Lic.

0 100.0 100. Encontramos el siguiente cuadro: Seleccionar el archivo que se desea abrir.0 Porcentaje acumulado 40.0 100.Como abrir o recuperar un archivo de SPSS Paso 1: Ir al menú principal y seleccionar “Archivo” Paso 2 : Seleccionar “Abrir” Paso 3.0 Porcentaje válido 40. Lic. RAUL RUIZ ARIAS 6 .0 60.CURSO DE SPSS al hacer clic en la flecha Hacer clic en Aceptar sexo Frecuencia 4 6 10 Porcentaje 40..0 Válidos mujer hombre Total 4.0 60.

.Presionar el botón Valores antiguos y nuevos. => en valor ingresar 1. creando la variable Edad 2. => presionar Añadir luego. presionar Cambiar 3. en Rango ingresar 11 hasta 20 => en valor ingresar 2.CURSO DE SPSS Ejemplo de tabulación de datos.En el menú principal: de 1 a 10 años de 11 a 20 años de 21 a 30 años.Ingresar la información en un archivo de datos. Transformar => Recodificar En Distintas Variables (los resultados van a una variable diferente) Se ingresa el nombre del archivo de salida. basándose en los siguientes rangos de edad: Primer grupo : Segundo grupo : Tercer grupo : Pasos: 1.. RAUL RUIZ ARIAS 7 ..En el cuadro anterior: Primero.. en Rango ingresar 21 hasta 30 =>en valor ingresar 3.. nos sale el siguiente cuadro: 4.Se tiene la siguiente información sobre la edad de 10 pacientes: 8 12 23 11 9 10 15 20 11 27 Se desea clasificar la información en una tabla de frecuencias. =>presionar Añadir presionar Continuar. luego Aceptar Lic. => presionar Añadir finalmente. en Rango ingresar 1 hasta 10.

Luego: en el menú principal ir a: Analizar.0 Valid 01 . en la parte inferior izquierda de la pantalla presionar “Vista de Variables”.0 100.0 20.0 Valid Percent 30.0 100.30 Total Lic.10 11 . RANGO Frequency 3 5 2 10 Percent 30. Estadista Descriptiva. Aceptar 6. Frecuencias.20 21 ..0 20. presionar Añadir. presionar Añadir en Valor ingresar 2 en Etiqueta de valor 11 -20. en esta ventana en la opción Valores : en Valor ingresar 1 en Etiqueta de valor 01 -10.Hemos construido la variable “rango”. seleccionar la variable Rango y Aceptar.0 Cumulative Percent 30.0 80. RAUL RUIZ ARIAS 8 .. presionar Añadir en Valor ingresar 3 en Etiqueta de valor 21 -30.0 100.CURSO DE SPSS 5.0 50.0 50.

sav. encontramos el siguiente grafico: Lic. luego encontramos la siguiente ventana: Seleccionar la variable de interés. en este caso la variable “sexo” y presionar de la opción “Definir sectores por”. RAUL RUIZ ARIAS 9 . seleccionar Gráficos. encontramos la siguiente ventana: Presionar “Aceptar”.CURSO DE SPSS Gráficos Grafico de sectores Con el ejemplo ejemplo_1. ir al menú principal. luego sectores: Presionar definir.

RAUL RUIZ ARIAS 10 .CURSO DE SPSS Es posible editar el gráfico presionando dos veces con el mouse en el gráfico para abrir el editor de gráficos: Lic.

.1. En este segundo caso. Este análisis nos permitirá controlar la presencia de posibles errores en la fase de introducción de los datos. dispersión y forma de la distribución. se solicitan los estadísticos y las gráficas que queremos obtener. Descriptivos y Explorar 2. una vez introducidos los mismos. media.CURSO DE SPSS II. Grado de agresividad • VARIABLES CUANTITATIVAS. es realizar un análisis descriptivo de la muestra. La elección de los estadísticos dependerá del tipo de variable a analizar.. Este análisis inicial también nos proporcionará una idea de la forma que tienen los datos: su posible distribución de probabilidad con sus parámetros de centralización.- Son aquellas variables elementos toman valores numericos.ANÁLISIS DESCRIPTIVO 2. Deporte que practica. todas ellas bajo el menú Analizar (Analyze) y.2. mientras que para el caso de variables cualitativas esto no tiene sentido. Sexo...2. detectaremos con él valores fuera de rango (p. etc El SPSS proporciona varias herramientas para realizar esta descripción.Son variables cuyos elementos toman valores no numéricos con ausencia de orden entre ellos Ejemplos: Estados civil. un peso de 500 Kg es claramente un dato extraño). Una vez decidida(s) la(s) variable(s) a analizar. el interés se centrará en la obtención de la tabla de frecuencias.. Lic. Lugar de nacimiento • VARIABLES CUALITATIVAS EN ESCALA ORDINAL. o la presencia de valores perdidos. dentro de él.INTRODUCCIÓN Clasificación según el tipo de variables: • VARIABLES CUALITATIVAS EN ESCALA NOMINAL. desviación típica. así como sus parámetros de dispersión. varianza. ej.PROCEDIMIENTO FRECUENCIAS La ejecución de este procedimiento resulta en un gran número de resultados gráficos y de tablas con información numérica. RAUL RUIZ ARIAS 11 . Profesión. Orden de merito. Clase social. . es decir.1. En el caso de variables cuantitativas tiene sentido la solicitud de estadísticos de centralización.Son aquellas variables cuyos elementos toman valores no numéricos con presencia de orden entre ellos Ejemplo Grado de instrucción.ANÁLISIS DESCRIPTIVO CON SPSS El primer paso en el análisis de datos. la opción Estadísticos descriptivos (Descriptive Statistics). mediana y moda. Estos procedimientos son: Frecuencias. 2.

Sirvan estas notas como una breve exposición de las características generales en el manejo de los procedimientos gráficos. su lugar debería ser preponderante sobre los anteriores.. 2. mediante Explorar. el SPSS cuenta con un menú dedicado expresamente a la producción de resultados gráficos. en este caso relativo a un gráfico de barras.PROCEDIMIENTO EXPLORAR Aunque la presentación de este procedimiento se ha dejado para el final.CURSO DE SPSS Las tablas de frecuencias pueden ordenarse según el valor de la variable o según las frecuencias observadas. Seleccionándolo con el Mouse y pulsando dos veces sobre el mismo se abre el editor de gráficos Lic.3.. varianza.2. el procedimiento Descriptivos genera descripciones numéricas de las variables cuantitativas (media. aunque algo más limitado pues no cuenta con la posibilidad de generar gráficas. Una vez confirmada la definición del gráfico mediante el correspondiente botón de aceptar. se puede obtener el resto de resultados antes expuestos. 2.PROCEDIMIENTO DESCRIPTIVOS De forma similar al anterior procedimiento de frecuencias. Dentro del procedimiento Explorar se puede solicitar el cálculo de distintos estadísticos y la generación de distintas gráficas. que sólo es posible obtenerlas a través del procedimiento frecuencias. Esto generalmente se realiza a través de un cuadro de diálogo específico.2. El procedimiento estándar de generación de gráficos se inicia con la elección de Graphs del menú principal y del tipo de gráfico deseado.2. Tras esta elección el programa solicita mayor información acerca de las características del gráfico deseado.. en el visor de resultados aparece el gráfico creado. Para aquellas variables con un gran número de valores diferentes se puede optar por suprimir dicha tabla. 2.PROCEDIMIENTO GRÁFICOS Además de las gráficas producidas por los anteriores procedimientos descriptivos.).2. desviación. A excepción de las tablas de frecuencias.4. etc. RAUL RUIZ ARIAS 12 .

La variable “Tipo de Shock”.0 28. se puede clasificar como: Hipovolemico • Cardiogenico • Distributivo • Obstructivo La variable TSHOCK toma valores no numéricos que describen cualidades.2 11. Esta variable corresponde al tipo cualitativo y la medida de sus posibles valores es nominal.0 Valid Percent 26. se administrará el fármaco a un grupo de 103 pacientes (archivo: 1_tshock). se desea una descripción del grupo de estudio.2 11.2 60.2 88.3. Antes de proceder al estudio. Para comprobarlo. se puede seguir los pasos que se presentan en el siguiente cuadro de dialogo: Analyse -> Descriptive Statistics-> Frequencies Seleccionar la Variable: Tipo de Shock(TSHOCK).0 3 0 2 0 Frequency 1 0 0 H o lé ic ip vo m o C rd g nic a io é o D trib is utivo O s tivo b truc Tipo de shock Lic.CURSO DE SPSS 2.7 100. Identificado como TSHOCK. RAUL RUIZ ARIAS 13 .EJEMPLOS APLICATIVOS Ejemplo 1: Variable NOMINAL Estudiaremos el efecto de un fármaco del que se sabe aumenta el índice cardiaco en pacientes con Shock.3 100.2 34.2 34.0 28. Para poder crear la tabla de distribución de frecuencia de la variable. las cuales no presentan ningún orden natural. luego ► Estadístico a evaluar: Statistics -> mode Graficos: Charts -> Bar Charts Frequencies (el eje y son frecuencias) OK (enter) RESULTADOS: Statistics Tipo de shock N Valid Missing Mode 103 0 2 Tipo de shock Frequency 27 35 29 12 103 T o de sh ip ock 4 0 Valid Hipovolémico Cardiogénico Distributivo Obstructivo Total Percent 26..0 Cumulative Percent 26.7 100.

se analizará su efecto considerando el grado de Extensión del cáncer al inicio del tratamiento.2 12.5 8.4 25.4 78.5 8.0 Valid Percent 38.0 15.CURSO DE SPSS Ejemplo 2: Variable ORDINAL Se desea estudiar el efecto de un tratamiento en pacientes con cáncer de colon. antes de proceder al estudio. sin afectar a ganglios(B2) Limitada a pared con ganglios afectados(C1) A través de todas las capas de la pared con ganglios afectados(C2) Es decir.0 Valid A B1 B2 C1 C2 Total PRACTICA Lic.0 Cumulative Percent 38. además presentan un orden natural (de menor a mayor Extensión) Utilizando el archivo 2_cancer.1 100.0 15.4 25. la variable CANCER toma valores no numéricos que describen cualidades. Asume los siguientes valores: • • • • • Limitado por mucosa(A) Extensión muscular propia sin penetrar en ella y sin afectar a ganglios(B1) A través de toda la pared.00 RESULTADOS: Mode 1 Grado de extensión del cáncer Frequency 43 28 17 14 10 112 Percent 38. debe seguir los siguientes pasos: Analyse => Descriptive Statistics => Frequencies Seleccionar la Variable => Grado de Statistics del cáncer(CANCER) extensión Estadísticos: Statistics Gradomode Median => de extensión del cáncer N Valid quartiles 112 Missing Formato de salida: Format => Ascending Values (ordenar valores ascendentes) 0 Median OK(enter) 2.9 100.2 12. durante un periodo. se realizara una Análisis del grupo de estudio. La variable “Grado de Extensión del cáncer” ( identificado como CANCER) según la clasificación modificada del carcinoma de colon de Duke.6 91.9 100. Por lo tanto. Se aplica el tratamiento a un grupo de pacientes. RAUL RUIZ ARIAS 14 .4 63. se sospecha que dicho efecto es distinto según el grado de Extensión del cáncer.

75 2. 25 3.8176 Índice cardíaco (l/m2) 16 14 12 10 8 6 Frequency 4 2 0 Std. 25 4. 5 . 75 3. 25 2. los datos se encuentran en el archivo: 3_índice cardiaco Pasos: Analyze => Descriptive Statistics => Frequencies Variable : índice cardiaco(IC) Estadísticos(Statistics) : Valores percentiles: percentile(s): 2.Realizar un estudio descriptivo de la normalidad para la variable índice cardiaco(IC).0029 6.5 Add. 75 6.7 Índice cardíaco (l/m2) Lic.CURSO DE SPSS 1. continue Gráficos( Charts) : tipo de Grafico: Histograma (Histograms) Con curva Normal (with normal curve). 75 1. 25 1.0689 1.. Dev = 1. 25 5.5 16 84 97.00 25 7.94 N = 111. RAUL RUIZ ARIAS 15 . 75 5. 75 4.30 Mean = 2.6076 4. 25 6.5 111 0 1.5 16 84 97. continue Desmarcar : mostrar Tabla de frecuencias(Display frequency tables) ACEPTAR Statistics Índice cardíaco (l/m2) N Valid Missing Percentiles 2.

1.9954 Std.9954 : 0. se miden sus niveles de hemoglobina. (gr/100 ml) 70 Mean 14. EJEMPLO: Supóngase que se sospecha que un tratamiento para la artrosis puede producir descenso en las cifras de hemoglobina plasmática en los hombres.53566 Std. obteniéndose que siguen una distribución Normal de media igual a 15. la opción Compare Means (comparar medias) permite realizar comparaciones de medias en distintas situaciones • • • Prueba t para una muestra Prueba t para muestras independientes Prueba t para muestras relacionadas 3. Hipótesis nula: El promedio de los niveles de hemoglobina es 15  H0: μ =15  H0: μ <15 Hipótesis nula: El promedio de los niveles de hemoglobina es menor que 15 Archivo: 4_hemoglobina_inicial.06402 Lectura de esta tabla: N=70 : en la muestra hay 70 datos el promedio aritmético de los datos es 14.PRUEBA T DE STUDENT DE 1 MUESTRA.COMPARANDO MEDIAS O PROMEDIOS Dentro del menú Analyze. . Error Mean . se desea comprobar que los resultados de la muestran coinciden con los de la población original. Deviation ..CURSO DE SPSS III . Al cierre del estudio únicamente se conoce el resultado del tratamiento en 70 pacientes.. Para comprobarlo se aplica un tratamiento sobre un conjunto de 100 hombres con artrosis. para ello se aplicara una prueba t de student para una muestra.53566 : Lic.9954 La desviación estándar ( raíz cuadrada de la varianza) es Mean=14. En el Cuadro de dialogo correspondiente se debe introducir la variable a analizar y el valor de la media con el que se quiere comparar.Para contrastar si la media de una población difiere significativamente de un valor dado.53566 Std Deviation= 0. antes de ser sometidos al tratamiento. el contraste indicado es la Prueba T para una muestra. RAUL RUIZ ARIAS 16 . Solución. pasos Analyze => Compare Means => One sample T test (Prueba T para una muestra) Test Variable (Contrastar variables): Hemoglobina inicial (hbi) Test Value (Valor de prueba) : 15 Aceptar One-Sample Statistics N Hemoglobina inicial.

es decir. el valor de sig del cuadro debe ser dividido entre 2 para poder compararlo con α=0.943/2=0.4715 resulto mayor que α se acepta H0: μ =15 Sig/2 -3 -2 -1 0 1 2 3 PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES Esta opción debe utilizarse cuando la comparación se realice entre las medias de dos poblaciones independientes (los individuos de una de las poblaciones son distintos a los individuos de la otra) como por ejemplo en el caso de la comparación de las poblaciones de hombres y mujeres.05. Lic.1323 . (gr/100 ml) -. en el cuadro de dialogo correspondiente debemos configurar el campo relativo a la variable de agrupación y posteriormente se deben definir los grupos a comparar mediante el botón definir. como el sig/2=0. RAUL RUIZ ARIAS 17 . existe una columna para los datos de la variable de interés y una segunda columna con los códigos que definen las poblaciones objeto de comparación.0046 En el caso bilateral sig=0. La matriz de datos debe estar configurada.072 df 69 Sig.943 Mean Difference -. Para el análisis.05.como el sig resulto mayor que α se acepta H0: μ =15 Sig/2 -3 -2 -1 0 Sig/2 1 2 3 Para nuestro ejemplo es el caso unilateral (H1: μ <15).943 se compara con α=0.CURSO DE SPSS O ne-Sample Test Test Value = 15 95% Confidence Interval of the Difference Lower Upper -.1231 t Hemoglobina inicial. (2-tailed) . Esta operación sustituirá los signos de interrogación que aparecen en la casilla de la variable de agrupación por los códigos de los grupos comparados.

6976 2.5 20.8 12.492 Lic.47 df 30 Sig.8 Fumadoras ¿ Es posible afirmar que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras? SOLUCION.44 26.4 23. Los resultados fueron los siguientes: Fumadoras No 30 30.1 19.019 Mean Difference 5.5 25.33519 . Error Difference 2.6976 Std.8 13.5 9.5 14.8 12.409 F NIVEL DE CADMIO Equal variances assumed Equal variances not assumed .82115 1.Archivo: 5_niveles_de_cadmio.7 9.5 17.4 12.90349 10.8 14.5 11.30702 2.98606 10.2 15 25.505 t 2.5 17. Deviation 6. (2-tailed) .4 10 8.7 . Error Mean 1.022 5.81411 6. se midieron los niveles de cadmio(nanogramos por gramo) en el tejido de la placenta de una muestra de 14 mujeres embarazadas que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras.20145 Std.7167 Std.5 9. RAUL RUIZ ARIAS 18 .1 15 24.4 28.CURSO DE SPSS EJEMPLO: En un estudio de factores que se consideran responsables de los efectos adversos del tabaquismo sobre la reproducción humana. pasos: Analizar => Comparar Medias => Prueba T para muestra independientes Contrastar variable : niveles de cadmio (NC) Variable de agrupación : fuma Definir grupos Grupo 1 : 1 Grupo 2 : 2 continuar Aceptar Group Statistics FUMA NIVEL DE CADMIO FUMADORA NO FUMADORA N 14 18 Mean 20.5 15.46170 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Lower Upper .456 Sig.4 7.8 16. .8 25 11.4143 14.1 30.4 12.

en los diseños apareados. la prueba que se aplicara es la t de student para dos muestras relacionadas. RAUL RUIZ ARIAS 19 . las dos muestras deben estar en dos variables distintas de la matriz de datos y debe formarse la pareja de muestras antes de poder ser añadida la comparación a la lista de variables relacionadas.CURSO DE SPSS PRUEBA T DE STUDENT PARA MUESTRAS RELACIONADAS Existe una segunda alternativa para contrastar dos medias. se analiza de nuevo la hemoglobina. EJEMPLO: Supóngase que se sospecha de que un tratamiento para la artrosis puede producir descenso en las cifras de hemoglobina plasmática en hombres. es decir. diseños en los que los mismos individuos son observados antes y después de una determinada intervención o en los diseños en los que las muestras son emparejadas de acuerdo a una serie de variables para controlar su efecto (como por ejemplo en los diseños de casos y controles). Ésta se refiere al supuesto caso en el que las dos poblaciones no sean independientes. Para la realización de este análisis. Como se busca comparar la hemoglobina al inicio y al final del periodo. por ejemplo. Para comprobarlo se aplica a una muestra de hombres con artrosis en condiciones normales y después de un periodo de observación. el caso en el que se trate de poblaciones relacionadas. SOLUCION: Abrir el archivo hemoglobina_inicial_final Variables: hemoglobina inicial(HBI) y hemoglobina Final(HBF) Analizar => Comparar Medias => Prueba T para muestra relacionadas Variables relacionadas : HBI – HBF Aceptar Lic. Esta situación se encuentra.

0 9.Una aspirina de lenta absorción perdió hace poco parte de su participación en el mercado ante un nuevo competidor. alivia más pronto el malestar.5 5 16.0 13.Una empresa acaba de terminar una nueva campaña publicitaria a favor de su cereal natural para el desayuno.5 12. 10.5 18 17 Pruebe que el rendimiento de la clase fue el mismo en la evaluación parcial y final.Con la finalidad de comparar rendimientos parcial y final en el curso de Estadística.5 12.4 10. en consecuencia. Los resultados son los siguientes: Grupo A 10. Se registro el tiempo promedio de que el medicamento tardó en llegar a la corriente sanguínea de cada sujeto 1 2 3 4 5 6 7 8 9 sujeto Aspirina de lenta absorción 16.5 24. A continuación se da el consumo semanal(en onzas) del cereal por parte de los clientes: ANTES DESPUES 14 5 18 18 30 10 8 26 13 24 23 14 13 29 33 11 12 25 21 34 29 26 ¿Puede el gerente afirmar que la campaña ha conseguido incrementar la demanda del cereal? 5. RAUL RUIZ ARIAS 20 .CURSO DE SPSS PRACTICA DE COMPARACIÓN DE MEDIAS 1.5 15.4 11.2 10.2 9.5 10.¿ La privación sensorial tiene algún efecto sobre la frecuencia de las ondas alfa de las personas? Para responder a la pregunta. trigo y frutas secas.5 11. el gerente entrevisto a 11 clientes antes de iniciarla y otros 11 después de finalizarla. 3.5 14.8 10.4 Grupo B 11.5 8 10 FINAL Pruebe la hipótesis de que la nota final promedio de la clase fue por lo menos 13. por lo mismo.5 14.5 23.0 21.REGRESIÓN LINEAL SIMPLE Lic.0 20.7 11. Las notas fueron: 8 7.5 2.. Este anuncia en su publicidad que su marca penetra en la corriente sanguínea más rápidamente que la aspirina de absorción lenta y.9 11. Para probar la eficacia de la campaña. En otras 3 semanas a esos mismos sujetos se les administro el producto de la competencia. que la afirmación del competidor es falsa. se divide aleatoriamente en dos grupos a veinte voluntarios.0 10.0 15.0 11.8 11.9 4.. Las notas obtenidas fueron las siguientes: PARCIAL 15..5 10 14 16 12. .5 17. A la compañía productora de la aspirina le gustaría probar que no existe una diferencia significativa entre los dos productos y.. Al terminar el periodo experimental. mientras que los individuos del grupo B sirvieron como grupo control.8 9. hecho con nueces.6 10.5 10.2 10.Se tomo una muestra de 14 alumnos que rindieron el examen final del curso de Estadística . En una prueba preliminar.5 13.5 9 19 17 11.5 25.5 25.0 11. Los individuos del grupo A se sometieron a un periodo de privación sensorial durante 10 días.5 8. a 9 sujetos se les administro la aspirina de lenta absorción una vez al día durante 3 semanas.. se midió la frecuencia de las ondas alfa a partir de los electroencefalogramas de las personas.1 11.7 10.0 16.9 10.0 14.5 28.5 18. se tomó una muestra de 11 alumnos que rindieron el examen parcial.1 10.0 Competidor ¿hay diferencia significativa en el tiempo que los medicamentos tardan en llegar a la corriente sanguínea? I .

es decir.CURSO DE SPSS La Regresión lineal simple tiene como objeto estudiar cómo los cambios en una variable. (xn. denominado de los mínimos cuadrados..5 63. Y2). su representación gráfica es una línea recta. El primer problema es obtener los estimadores de los parámetros de la recta de regresión. n pares (x1.cm) y los pesos(Y. X “estatura” 152 155 152 155 157 152 157 165 162 178 183 178 Y “peso” 50 61. RAUL RUIZ ARIAS 21 . otra formulación del modelo de regresión lineal simple sería: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde.5 59 61 72 66 72 84 82 Realizar el grafico de dispersión y el análisis de los datos. es decir. permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos.. donde Ei = Yi .(a + b xi) es el error o desviación aleatoria de Yi ESTIMACIÓN DE LOS PARÁMETROS DE LA RECTA DE REGRESIÓN. SOLUCION En el SPSS. afectan a una variable aleatoria (Y). Y1) . en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal. El método de estimación aplicable en regresión. partiendo de una muestra de tamaño n. para el grafico de dispersión de datos. kg) de una muestra de 10 adultos. (x2. . Las estimaciones de los parámetros de la recta de regresión obtenidas con este procedimiento son: b= ∧ ∑ (x i =1 n n i − x)( y i − y ) i ∑ (x i =1 a = y −b x ∧ ∧ − x) 2 donde x e y son los promedios muestrales y = a + b x = y + b ( x − x) ∧ ∧ ∧ ∧ Por tanto la recta de regresión estimada será: EJEMPLO: Los datos de la siguiente tabla representan las estaturas (X. no aleatoria(X).5 54. De manera equivalente.. entonces Yi = a + b xi + Ei . se debe seguir los siguientes pasos: Graphs(Gráficos) -> Scatter (Dispersión) ->Simple -> Define( Definir) EJE X: estatura EJE Y: pesos Lic. que representan nuestra intención de extraer para cada xi un individuo de la población o variable Yi . Yn).5 57.

938 Lic. ESTATURA b. ESTATURA ANOVA b Modelo 1 Suma de cuadrados 1061.000 a Regresión Residual Total a. .868 .000 a.8105 Modelo 1 R .052 14.868 Error típ.868X Coeficiente de correlación: r = 0.574 8.520 F 73.548 Sig. Variable dependiente: PESOS Resumen del modelo R cuadrado . Todas las variables solicitadas introducidas b.101 t -4.443+0. RAUL RUIZ ARIAS 22 .938 a a.001 .880 R cuadrado corregida .250 gl 1 10 11 Media cuadrática 1061.198 1206. Método Introducir a. . de la estimación 3. Variables predictoras: (Constante). Variables predictoras: (Constante). Variable dependiente: PESOS Modelo Ajustado: y= .75.076 Sig.443 16.495 . Variable dependiente: PESOS Coeficientesa Coeficient es estandari zados Beta .938 Modelo 1 (Constante) ESTATURA Coeficientes no estandarizados B Error típ.052 145. -75.CURSO DE SPSS GAFICO DE DISPERSION 90 80 70 60 50 PESOS 40 150 160 170 180 190 ESTATURA Para el analizar si los datos se ajustan a una línea recta: Analyze (Analizar) -> Regresión(Regresión) -> Linear( Lineal) Dependiente : pesos Independiente : estaturas b Variables introducidas/eliminadas Modelo 1 Variables introducidas a ESTATURA Variables eliminadas .

5 27 0. Registró los datos correspondientes a los últimos 7 meses y encontró lo siguiente: Gastos mensuales en carteles( x 1000 soles) Ingresos mensuales por ventas ( x 105 soles) 3. las dos variables están correlacionadas? Obtenga la ecuación de regresión y grafíquela en el diagrama de dispersión En un estudio del efecto de un componente X de la dieta sobre la composición de los lípidos del plasma(Y).4 30 1.8 27 0. se obtuvieron los siguientes datos en una muestra de 14 individuos 46 X 18 21 28 35 47 33 40 41 28 21 44 38 30 38 40 47 54 66 52 59 60 47 40 63 57 49 65 Y e) Calcule el valor estimado para la concentración media en el plasma cuando el componente X mide 20 unidades.4 28 0.3 33 1.5 33 1.2 Lic.8 27 1. El departamento de mercadotecnia ha estudiado varias relaciones y piensa que los gastos mensuales destinados a carteles pueden ser significativos. Una cadena de tiendas de repostería ha tenido grandes fluctuaciones en sus ingresos durante los últimos años. 2.0 32 1.7 36 1.CURSO DE SPSS PRACTICA DE REGRESIÓN Para cada uno de los siguientes ejercicios: a) b) c) d) 1.1 32 1.2 34 1. nuevos productos y técnicas de publicidad se han utilizado durante este tiempo.9 32 1. RAUL RUIZ ARIAS 23 . 25 38 16 40 42 47 34 54 10 66 21 52 19 59 Los datos siguientes fueron reunidos como parte de un estudio en el que los sujetos eran niños prematuros con bajo peso Tiempo de gestación(semanas) Peso al nacer(Kg) Tiempo de gestación(semanas) Peso al nacer(Kg) 30 1. Elabore un diagrama de dispersión Calcule e interprete el coeficiente de correlación en la muestra Mediante una prueba de hipótesis ¿Se puede afirmar que en la población. por lo cual es difícil determinar cuales de esos factores tienen la mayor influencia en las ventas.3 29 1. Abundantes ofertas.4 35 1.2 31 1.0 35 1.8 26 0.

Paso 3. – Prueba Chi cuadrado Paso 1. un 6% reprobó todas las materias y un 4% se retiro. Nota . al final del semestre antepasado.cuadrado Componentes de la fórmula o estadístico de prueba: Oi = Frecuencia observada o empírica ei = Frecuencia teórica o esperada k = Número de clases o categorías que se analizan m = Número de parámetros estimados en base a los datos primarios y que se usan en la determinación de ei. basándose en informaciones anteriores.10 0. que la información del semestre antepasado se ha vuelto a repetir el semestre pasado? Hipótesis nula: de que los porcentajes del semestre pasado son los mismos que en el semestre antepasado.Como regla práctica se recomienda que la frecuencia teórica esperada en cualquier intervalo no sea menor que 5. Atributos Aprobó todo Aprobó la mitad Reprobó todo Se retiró Total χ2 = 27. Ha : La variable en estudio tiene un comportamiento aleatorio que no se ajusta a determinada distribución teórica.04 1 Datos esperados 320 40 24 16 400 Lic. Ho : La variable en estudio se ajusta a determinada distribución teórica (Uniforme. un 10% aprobó la mitad. Ejemplo 3. Cálculos previos y estimación de la frecuencia esperada o teórica Paso 4.80 0. Paso 2. exponencial. Establecimiento del nivel de significación o error tipo I.. siendo ei. se calcula a partir de la distribución estudiada.06 0. Al final del semestre pasado el departamento selecciono a 400 alumnos. si X2 calc < X2 tab Se rechaza la Ho si X2 calc > X2 tab Prueba Chi . Ello se logra generalmente combinando intervalos sucesivos.CURSO DE SPSS IV . resultado 287 aprobaron todas las asignaturas. 30 reprobaron todas las asignaturas y 34 se retiraron. 49 aprobaron la mitad. el 80% de los alumnos aprobaron todas las materias inscritas. la frecuencia teórica para cada clase.178 Datos observados 287 49 30 34 400 Probabilidad 0. ¿Podemos concluir. El Departamento de Psicología. RAUL RUIZ ARIAS 24 . normal. a raíz de los resultados. Criterios de decisión: Se acepta la Ho. poisson).

identificar las variables con las que trabajaremos Ponderando la base de datos Lic. Conclusión: Los porcentajes no se repitieron el semestre pasado Usando el SPSS 1.84 Como 27.84 se rechaza la hipótesis nula.3 = 12.CURSO DE SPSS Como tenemos 4 categorías y ningún parámetro estimado los grados de libertad serán: 4-1= 3 χ 02.10 0. RAUL RUIZ ARIAS 25 .05.178 es mayor que 12.04 1 Datos esperados 320 40 24 16 400 En la ventana vista de variables.06 0.Definir las variables de estudio Se tiene la siguiente información: Atributos Aprobó todo Aprobó la mitad Reprobó todo Se retiró Total Datos observados 287 49 30 34 400 Probabilida d 0.80 0..

RAUL RUIZ ARIAS 26 . encontramos: y clic en “Aceptar” Realizar la prueba Chi-Cuadrado (prueba de bondad de ajuste) Lic.CURSO DE SPSS Encontramos la siguiente ventana: Marcar frecuencias (variable a ponderar). marcar “Ponderar casos mediante”.

- Lic.CURSO DE SPSS y clic en “Aceptar” atributo Aprobó todo Aprobó la mitad Reprobó todo se retiro Total N observado 287 49 30 34 400 N esperado 320. RAUL RUIZ ARIAS 27 . Problema 4.0 18.0.0 Estadísticos de contraste a Chi-cuadrado gl Sig.0 16.178 3 .0 6.0 Residual -33.0%) tienen frecuencias esperadas menores que 5. asintót. atributo 27. la muestra tiene datos que no corresponden a la población.000 < 0. La frecuencia de casilla esperada mínima es 16.000 a.05 . El valor de Sig=0. 0 casillas (.0 9.0 40.0 24.

CURSO DE SPSS Problema 5. RAUL RUIZ ARIAS 28 .- Lic.

Sign up to vote on this title
UsefulNot useful