CURSO DE SPSS

SPSS I . - INTRODUCCIÓN AL SPSS
1.- MENU PRINCIPAL .- La versión del SPSS que estudiaremos es la 12.0,
en ella se puede observar un menú principal que la podemos describir de la siguiente manera: Archivo. Edición. Mediante este menú se pueden abrir, crear o grabar los diferentes ficheros que SPSS emplea. Igualmente, es posible controlar las tareas de impresión. Permite realizar las tareas habituales de edición: modificar, borrar, copiar, pegar, seleccionar etc. Ver. Permite controlar diversos parámetros de visualización en pantalla. datos: seleccionar, añadir, ponderar, etc. Transformar.

Datos. Este menú permite definir variables, así como efectuar modificaciones en los ficheros de

Aquí se encuentran todas las opciones relativas a la modificación y generación
de nuevas variables. Las funciones de este menú y del anterior son temporales, y solo están vigentes durante la sesión, sin que afecten al fichero original de datos.

Analizar. Gráficos. Utilidades.

Mediante este menú se accede a los diferentes análisis estadísticos que se hayan instalado. Permite la creación y edición de diversos tipos de gráficos de alta resolución. Entre otras, posibilita mostrar información sobre los ficheros de SPSS, las variables o el tratamiento de conjuntos de variables. Dispone de las funciones habituales para controlar las ventanas. Proporciona ayuda al usuario en el formato típico de Windows.

Ventana ?

Lic. RAUL RUIZ ARIAS

1

CURSO DE SPSS

2.- Para grabar un archivo de datos
Paso 1: Ir al menú principal y seleccionar “Archivo” Paso 2 : Seleccionar “Guardar como”

Paso 3. Encontramos el siguiente cuadro:

• •

Guardar en .- podemos seleccionar en que carpeta grabaremos el archivo de datos (debemos crear la carpeta “trabajo” donde guardaremos nuestros archivos) Nombre.- En este cuadro ingresaremos el nombre del archivo de datos.

Paso 4 : Presionar el botón “Guardar”. Observaciones • Se debe tener cuidado de no tener otro archivo con el mismo nombre. Si el archivo ya fue grabado anteriormente, no es necesario ir a la opción “grabar como” , en este caso seleccionar el botón “grabar”, y los cambios que hemos realizado se grabaran en este archivo.

• •

En la barra de herramienta, una forma rápida de grabar, si el archivo ya existe, es presionar en el icono: Cuando se trabaja con el SPSS, se genera un archivo que contienen los resultados de las operaciones realizadas, estos archivos se conocen como “Output”, el procedimiento para grabarlos es similar a los archivos de datos.

Lic. RAUL RUIZ ARIAS

2

en su definición debe especificarse únicamente su longitud máxima. y en consecuencia. AND. Le añade el símbolo del dólar en los diferentes formatos que aparecen en la ventana que se despliega caso de elegir esta opción.. TO. LE. RAUL RUIZ ARIAS 3 . NE. 2. GE. 3.. Así para las variables numéricas enteras cuyos valores oscilan entre 0 y 20 se puede ingresar: ancho 2 y cifras decimales 0. Admiten cualquier carácter.CURSO DE SPSS 3. 3. Seleccione la primera variable a trabajar y en la esquina inferior izquierda seleccione “Vista de variables”. no se pueden usar como nombres de variables. La extensión máxima de los nombres es de 8 caracteres. Ejemplos: ALL. pero debe iniciar con una letra. de forma que la codificación numérica es la que corresponde a las variables cuantitativas. OR. Es indiferente usar mayúsculas o minúsculas. SPSS exige que se asigne un nombre a cada variable con la finalidad de identificar correctamente los diferentes conjuntos de datos.TIPO DE VARIABLES EN SPSS (TYPE) Las variables que configuran una matriz de datos permiten distinguir entre variables cuantitativas y cualitativas. GT. EQ. y la alfanumérica la que mejor se adapta a las cualitativas. Admite cualquier número. Al presionar en el botón Tipo obtendrás lo siguiente: Numérica. puede ir precedido del signo más o del menos. BY.DEFINICIÓN DE LAS VARIABLES DE LA MATRIZ 1. Fecha. Su longitud máxima es de 40 caracteres de los cuales 16 pueden ser cifras decimales. LT. Hay una serie de palabras claves que tienen un significado especial para SPSS. Cadena. Permite formatos para fecha Dólar.1. NOT. 4. WITH. Lic.

Asumamos que tenemos el siguiente grupo de personas: Hombre. se teclea el código del valor de la variable.En la opción “Vista de variables” se debe identificar la variable en estudio: Lic. Hombre. con lo que la correspondencia entre el valor y la etiqueta queda incorporada a la lista.El siguiente ejemplo nos permitirá observar como se ingresan datos al SPSS..al ingresar los datos al SPSS se debe codificar la información para que sea más fácil su análisis..Etiquetas de valor (Valores) En primer lugar.. Mujer. Ejemplo 1 . El proceso se repite con todos los valores de la variable que se quieran etiquetar. Hombre. Paso 2. A continuación. Mujer Pasos para ingresar datos al SPSS: Paso 1. Hombre. Una vez acabado el proceso.CURSO DE SPSS 3.. Hombre.. el texto de la etiqueta en el cuadro correspondiente a Etiqueta de valor finalmente. en el cuadro correspondiente a Valor. guardar el archivo con el nombre Ejemplo_1 en nuestra carpeta de trabajo. se pulsa el botón Añadir. Hombre. en este caso Hombre es 1 y mujer es 0. Mujer. Mujer. se pulsa el botón Aceptar.2. RAUL RUIZ ARIAS 4 .

Que pasa si nos interesa resumir nuestra información? En el menú principal: Analizar => Estadísticos descriptivos => Frecuencias Lic.. RAUL RUIZ ARIAS 5 .CURSO DE SPSS Nombre de la variable Tipo Ancho Decimales : : : : sexo numérico 2 dígitos sin decimales En la opción “Valores” Nuestro archivo queda de la siguiente manera: Paso 3.

0 Porcentaje acumulado 40.0 60. Encontramos el siguiente cuadro: Seleccionar el archivo que se desea abrir. RAUL RUIZ ARIAS 6 .0 60.0 100.CURSO DE SPSS al hacer clic en la flecha Hacer clic en Aceptar sexo Frecuencia 4 6 10 Porcentaje 40.Como abrir o recuperar un archivo de SPSS Paso 1: Ir al menú principal y seleccionar “Archivo” Paso 2 : Seleccionar “Abrir” Paso 3. Lic.0 100.0 Válidos mujer hombre Total 4..0 100.0 Porcentaje válido 40.

creando la variable Edad 2.En el menú principal: de 1 a 10 años de 11 a 20 años de 21 a 30 años.. => presionar Añadir luego.Se tiene la siguiente información sobre la edad de 10 pacientes: 8 12 23 11 9 10 15 20 11 27 Se desea clasificar la información en una tabla de frecuencias. => en valor ingresar 1.CURSO DE SPSS Ejemplo de tabulación de datos. en Rango ingresar 21 hasta 30 =>en valor ingresar 3.. en Rango ingresar 11 hasta 20 => en valor ingresar 2. nos sale el siguiente cuadro: 4. Transformar => Recodificar En Distintas Variables (los resultados van a una variable diferente) Se ingresa el nombre del archivo de salida. luego Aceptar Lic. =>presionar Añadir presionar Continuar. => presionar Añadir finalmente. RAUL RUIZ ARIAS 7 ..En el cuadro anterior: Primero..Presionar el botón Valores antiguos y nuevos.Ingresar la información en un archivo de datos. en Rango ingresar 1 hasta 10. basándose en los siguientes rangos de edad: Primer grupo : Segundo grupo : Tercer grupo : Pasos: 1. presionar Cambiar 3..

0 20. presionar Añadir.0 100.0 50. RANGO Frequency 3 5 2 10 Percent 30.0 100. Frecuencias. presionar Añadir en Valor ingresar 2 en Etiqueta de valor 11 -20. presionar Añadir en Valor ingresar 3 en Etiqueta de valor 21 -30.0 Valid 01 . Estadista Descriptiva. en esta ventana en la opción Valores : en Valor ingresar 1 en Etiqueta de valor 01 -10.0 20.10 11 ..20 21 . en la parte inferior izquierda de la pantalla presionar “Vista de Variables”.0 100.0 Valid Percent 30.0 80.0 50.0 Cumulative Percent 30. seleccionar la variable Rango y Aceptar.30 Total Lic.Hemos construido la variable “rango”. RAUL RUIZ ARIAS 8 .CURSO DE SPSS 5. Aceptar 6..Luego: en el menú principal ir a: Analizar.

RAUL RUIZ ARIAS 9 .CURSO DE SPSS Gráficos Grafico de sectores Con el ejemplo ejemplo_1. luego sectores: Presionar definir. seleccionar Gráficos. encontramos la siguiente ventana: Presionar “Aceptar”. encontramos el siguiente grafico: Lic. luego encontramos la siguiente ventana: Seleccionar la variable de interés. ir al menú principal. en este caso la variable “sexo” y presionar de la opción “Definir sectores por”.sav.

CURSO DE SPSS Es posible editar el gráfico presionando dos veces con el mouse en el gráfico para abrir el editor de gráficos: Lic. RAUL RUIZ ARIAS 10 .

así como sus parámetros de dispersión.Son variables cuyos elementos toman valores no numéricos con ausencia de orden entre ellos Ejemplos: Estados civil. mientras que para el caso de variables cualitativas esto no tiene sentido.. media.1. Profesión.CURSO DE SPSS II..2.ANÁLISIS DESCRIPTIVO 2.PROCEDIMIENTO FRECUENCIAS La ejecución de este procedimiento resulta en un gran número de resultados gráficos y de tablas con información numérica. Grado de agresividad • VARIABLES CUANTITATIVAS. En el caso de variables cuantitativas tiene sentido la solicitud de estadísticos de centralización. RAUL RUIZ ARIAS 11 .2. Clase social. Descriptivos y Explorar 2..INTRODUCCIÓN Clasificación según el tipo de variables: • VARIABLES CUALITATIVAS EN ESCALA NOMINAL. el interés se centrará en la obtención de la tabla de frecuencias. dentro de él. detectaremos con él valores fuera de rango (p. mediana y moda. varianza.Son aquellas variables cuyos elementos toman valores no numéricos con presencia de orden entre ellos Ejemplo Grado de instrucción. La elección de los estadísticos dependerá del tipo de variable a analizar. Estos procedimientos son: Frecuencias. es realizar un análisis descriptivo de la muestra.. Este análisis inicial también nos proporcionará una idea de la forma que tienen los datos: su posible distribución de probabilidad con sus parámetros de centralización.1. Orden de merito. desviación típica. En este segundo caso. Lugar de nacimiento • VARIABLES CUALITATIVAS EN ESCALA ORDINAL. todas ellas bajo el menú Analizar (Analyze) y. una vez introducidos los mismos. . Sexo. etc El SPSS proporciona varias herramientas para realizar esta descripción. o la presencia de valores perdidos. se solicitan los estadísticos y las gráficas que queremos obtener. Deporte que practica.ANÁLISIS DESCRIPTIVO CON SPSS El primer paso en el análisis de datos.. ej. 2. la opción Estadísticos descriptivos (Descriptive Statistics). es decir. un peso de 500 Kg es claramente un dato extraño). Una vez decidida(s) la(s) variable(s) a analizar. dispersión y forma de la distribución.- Son aquellas variables elementos toman valores numericos. Este análisis nos permitirá controlar la presencia de posibles errores en la fase de introducción de los datos. Lic.

aunque algo más limitado pues no cuenta con la posibilidad de generar gráficas. el SPSS cuenta con un menú dedicado expresamente a la producción de resultados gráficos.CURSO DE SPSS Las tablas de frecuencias pueden ordenarse según el valor de la variable o según las frecuencias observadas. se puede obtener el resto de resultados antes expuestos. mediante Explorar.2. etc. Seleccionándolo con el Mouse y pulsando dos veces sobre el mismo se abre el editor de gráficos Lic.2. 2.2. su lugar debería ser preponderante sobre los anteriores.. A excepción de las tablas de frecuencias. 2. Sirvan estas notas como una breve exposición de las características generales en el manejo de los procedimientos gráficos.PROCEDIMIENTO EXPLORAR Aunque la presentación de este procedimiento se ha dejado para el final.3. Una vez confirmada la definición del gráfico mediante el correspondiente botón de aceptar.PROCEDIMIENTO GRÁFICOS Además de las gráficas producidas por los anteriores procedimientos descriptivos. en este caso relativo a un gráfico de barras.PROCEDIMIENTO DESCRIPTIVOS De forma similar al anterior procedimiento de frecuencias. Para aquellas variables con un gran número de valores diferentes se puede optar por suprimir dicha tabla. El procedimiento estándar de generación de gráficos se inicia con la elección de Graphs del menú principal y del tipo de gráfico deseado. Dentro del procedimiento Explorar se puede solicitar el cálculo de distintos estadísticos y la generación de distintas gráficas.4. el procedimiento Descriptivos genera descripciones numéricas de las variables cuantitativas (media. en el visor de resultados aparece el gráfico creado. que sólo es posible obtenerlas a través del procedimiento frecuencias.. desviación. Esto generalmente se realiza a través de un cuadro de diálogo específico. Tras esta elección el programa solicita mayor información acerca de las características del gráfico deseado.2. 2. varianza.).. RAUL RUIZ ARIAS 12 .

EJEMPLOS APLICATIVOS Ejemplo 1: Variable NOMINAL Estudiaremos el efecto de un fármaco del que se sabe aumenta el índice cardiaco en pacientes con Shock.2 88. Antes de proceder al estudio.0 Cumulative Percent 26.CURSO DE SPSS 2. Para comprobarlo. se desea una descripción del grupo de estudio.7 100.2 11.0 Valid Percent 26. se puede clasificar como: Hipovolemico • Cardiogenico • Distributivo • Obstructivo La variable TSHOCK toma valores no numéricos que describen cualidades.2 60. luego ► Estadístico a evaluar: Statistics -> mode Graficos: Charts -> Bar Charts Frequencies (el eje y son frecuencias) OK (enter) RESULTADOS: Statistics Tipo de shock N Valid Missing Mode 103 0 2 Tipo de shock Frequency 27 35 29 12 103 T o de sh ip ock 4 0 Valid Hipovolémico Cardiogénico Distributivo Obstructivo Total Percent 26.0 28. se administrará el fármaco a un grupo de 103 pacientes (archivo: 1_tshock).7 100..2 34.0 3 0 2 0 Frequency 1 0 0 H o lé ic ip vo m o C rd g nic a io é o D trib is utivo O s tivo b truc Tipo de shock Lic. Esta variable corresponde al tipo cualitativo y la medida de sus posibles valores es nominal.2 11. Para poder crear la tabla de distribución de frecuencia de la variable. se puede seguir los pasos que se presentan en el siguiente cuadro de dialogo: Analyse -> Descriptive Statistics-> Frequencies Seleccionar la Variable: Tipo de Shock(TSHOCK).3.0 28.3 100. las cuales no presentan ningún orden natural.2 34. RAUL RUIZ ARIAS 13 . Identificado como TSHOCK. La variable “Tipo de Shock”.

9 100.6 91.4 25.4 78.0 Valid A B1 B2 C1 C2 Total PRACTICA Lic.0 15.9 100.0 Cumulative Percent 38.5 8.2 12. se analizará su efecto considerando el grado de Extensión del cáncer al inicio del tratamiento. la variable CANCER toma valores no numéricos que describen cualidades. sin afectar a ganglios(B2) Limitada a pared con ganglios afectados(C1) A través de todas las capas de la pared con ganglios afectados(C2) Es decir.2 12. Asume los siguientes valores: • • • • • Limitado por mucosa(A) Extensión muscular propia sin penetrar en ella y sin afectar a ganglios(B1) A través de toda la pared.CURSO DE SPSS Ejemplo 2: Variable ORDINAL Se desea estudiar el efecto de un tratamiento en pacientes con cáncer de colon.00 RESULTADOS: Mode 1 Grado de extensión del cáncer Frequency 43 28 17 14 10 112 Percent 38. antes de proceder al estudio. se sospecha que dicho efecto es distinto según el grado de Extensión del cáncer. durante un periodo. se realizara una Análisis del grupo de estudio.4 63.0 15. La variable “Grado de Extensión del cáncer” ( identificado como CANCER) según la clasificación modificada del carcinoma de colon de Duke. además presentan un orden natural (de menor a mayor Extensión) Utilizando el archivo 2_cancer.5 8. debe seguir los siguientes pasos: Analyse => Descriptive Statistics => Frequencies Seleccionar la Variable => Grado de Statistics del cáncer(CANCER) extensión Estadísticos: Statistics Gradomode Median => de extensión del cáncer N Valid quartiles 112 Missing Formato de salida: Format => Ascending Values (ordenar valores ascendentes) 0 Median OK(enter) 2.0 Valid Percent 38. RAUL RUIZ ARIAS 14 .4 25.1 100. Se aplica el tratamiento a un grupo de pacientes. Por lo tanto.

5 111 0 1.0689 1.6076 4. Dev = 1. 25 6.7 Índice cardíaco (l/m2) Lic. continue Desmarcar : mostrar Tabla de frecuencias(Display frequency tables) ACEPTAR Statistics Índice cardíaco (l/m2) N Valid Missing Percentiles 2. 25 5.30 Mean = 2. 25 3. RAUL RUIZ ARIAS 15 .0029 6. 25 1. 75 4.. 25 4. 25 2.CURSO DE SPSS 1.5 Add.00 25 7.94 N = 111. continue Gráficos( Charts) : tipo de Grafico: Histograma (Histograms) Con curva Normal (with normal curve).5 16 84 97.5 16 84 97. 75 3.8176 Índice cardíaco (l/m2) 16 14 12 10 8 6 Frequency 4 2 0 Std. 75 5. 75 1. 5 . 75 2.Realizar un estudio descriptivo de la normalidad para la variable índice cardiaco(IC). los datos se encuentran en el archivo: 3_índice cardiaco Pasos: Analyze => Descriptive Statistics => Frequencies Variable : índice cardiaco(IC) Estadísticos(Statistics) : Valores percentiles: percentile(s): 2. 75 6.

la opción Compare Means (comparar medias) permite realizar comparaciones de medias en distintas situaciones • • • Prueba t para una muestra Prueba t para muestras independientes Prueba t para muestras relacionadas 3. . antes de ser sometidos al tratamiento. Al cierre del estudio únicamente se conoce el resultado del tratamiento en 70 pacientes.. se desea comprobar que los resultados de la muestran coinciden con los de la población original. Para comprobarlo se aplica un tratamiento sobre un conjunto de 100 hombres con artrosis. obteniéndose que siguen una distribución Normal de media igual a 15. Hipótesis nula: El promedio de los niveles de hemoglobina es 15  H0: μ =15  H0: μ <15 Hipótesis nula: El promedio de los niveles de hemoglobina es menor que 15 Archivo: 4_hemoglobina_inicial.1. EJEMPLO: Supóngase que se sospecha que un tratamiento para la artrosis puede producir descenso en las cifras de hemoglobina plasmática en los hombres. En el Cuadro de dialogo correspondiente se debe introducir la variable a analizar y el valor de la media con el que se quiere comparar.53566 Std Deviation= 0. RAUL RUIZ ARIAS 16 .PRUEBA T DE STUDENT DE 1 MUESTRA.COMPARANDO MEDIAS O PROMEDIOS Dentro del menú Analyze. para ello se aplicara una prueba t de student para una muestra.CURSO DE SPSS III . se miden sus niveles de hemoglobina.9954 La desviación estándar ( raíz cuadrada de la varianza) es Mean=14. Deviation . pasos Analyze => Compare Means => One sample T test (Prueba T para una muestra) Test Variable (Contrastar variables): Hemoglobina inicial (hbi) Test Value (Valor de prueba) : 15 Aceptar One-Sample Statistics N Hemoglobina inicial..Para contrastar si la media de una población difiere significativamente de un valor dado.53566 : Lic. Error Mean .9954 Std.06402 Lectura de esta tabla: N=70 : en la muestra hay 70 datos el promedio aritmético de los datos es 14. Solución. (gr/100 ml) 70 Mean 14.53566 Std. el contraste indicado es la Prueba T para una muestra.9954 : 0.

como el sig resulto mayor que α se acepta H0: μ =15 Sig/2 -3 -2 -1 0 Sig/2 1 2 3 Para nuestro ejemplo es el caso unilateral (H1: μ <15).05. el valor de sig del cuadro debe ser dividido entre 2 para poder compararlo con α=0.0046 En el caso bilateral sig=0. La matriz de datos debe estar configurada.1231 t Hemoglobina inicial. Esta operación sustituirá los signos de interrogación que aparecen en la casilla de la variable de agrupación por los códigos de los grupos comparados. RAUL RUIZ ARIAS 17 .05.943/2=0. (gr/100 ml) -.4715 resulto mayor que α se acepta H0: μ =15 Sig/2 -3 -2 -1 0 1 2 3 PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES Esta opción debe utilizarse cuando la comparación se realice entre las medias de dos poblaciones independientes (los individuos de una de las poblaciones son distintos a los individuos de la otra) como por ejemplo en el caso de la comparación de las poblaciones de hombres y mujeres.CURSO DE SPSS O ne-Sample Test Test Value = 15 95% Confidence Interval of the Difference Lower Upper -.072 df 69 Sig.1323 . en el cuadro de dialogo correspondiente debemos configurar el campo relativo a la variable de agrupación y posteriormente se deben definir los grupos a comparar mediante el botón definir. Lic. (2-tailed) . es decir.943 se compara con α=0. Para el análisis. existe una columna para los datos de la variable de interés y una segunda columna con los códigos que definen las poblaciones objeto de comparación.943 Mean Difference -. como el sig/2=0.

Los resultados fueron los siguientes: Fumadoras No 30 30.505 t 2.5 17.7167 Std.1 15 24.47 df 30 Sig.5 20.4 12.8 14.456 Sig.8 Fumadoras ¿ Es posible afirmar que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras? SOLUCION.1 19.8 12.82115 1.98606 10.7 9.6976 2.CURSO DE SPSS EJEMPLO: En un estudio de factores que se consideran responsables de los efectos adversos del tabaquismo sobre la reproducción humana.4 10 8.46170 Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Lower Upper .44 26. pasos: Analizar => Comparar Medias => Prueba T para muestra independientes Contrastar variable : niveles de cadmio (NC) Variable de agrupación : fuma Definir grupos Grupo 1 : 1 Grupo 2 : 2 continuar Aceptar Group Statistics FUMA NIVEL DE CADMIO FUMADORA NO FUMADORA N 14 18 Mean 20.33519 . .6976 Std.4 7.20145 Std.019 Mean Difference 5.409 F NIVEL DE CADMIO Equal variances assumed Equal variances not assumed .5 9.4 28. Deviation 6.4 23.5 25. Error Difference 2.30702 2.8 12.8 16. RAUL RUIZ ARIAS 18 .5 9.Archivo: 5_niveles_de_cadmio.4143 14. se midieron los niveles de cadmio(nanogramos por gramo) en el tejido de la placenta de una muestra de 14 mujeres embarazadas que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras.81411 6.5 11.5 14.1 30.8 13. Error Mean 1.8 25 11.7 .492 Lic.022 5.4 12.2 15 25. (2-tailed) .5 17.5 15.90349 10.

RAUL RUIZ ARIAS 19 . el caso en el que se trate de poblaciones relacionadas. EJEMPLO: Supóngase que se sospecha de que un tratamiento para la artrosis puede producir descenso en las cifras de hemoglobina plasmática en hombres. las dos muestras deben estar en dos variables distintas de la matriz de datos y debe formarse la pareja de muestras antes de poder ser añadida la comparación a la lista de variables relacionadas. SOLUCION: Abrir el archivo hemoglobina_inicial_final Variables: hemoglobina inicial(HBI) y hemoglobina Final(HBF) Analizar => Comparar Medias => Prueba T para muestra relacionadas Variables relacionadas : HBI – HBF Aceptar Lic.CURSO DE SPSS PRUEBA T DE STUDENT PARA MUESTRAS RELACIONADAS Existe una segunda alternativa para contrastar dos medias. Esta situación se encuentra. Como se busca comparar la hemoglobina al inicio y al final del periodo. por ejemplo. en los diseños apareados. Ésta se refiere al supuesto caso en el que las dos poblaciones no sean independientes. Para la realización de este análisis. se analiza de nuevo la hemoglobina. es decir. Para comprobarlo se aplica a una muestra de hombres con artrosis en condiciones normales y después de un periodo de observación. diseños en los que los mismos individuos son observados antes y después de una determinada intervención o en los diseños en los que las muestras son emparejadas de acuerdo a una serie de variables para controlar su efecto (como por ejemplo en los diseños de casos y controles). la prueba que se aplicara es la t de student para dos muestras relacionadas.

5 10.8 9. se tomó una muestra de 11 alumnos que rindieron el examen parcial.5 8 10 FINAL Pruebe la hipótesis de que la nota final promedio de la clase fue por lo menos 13.5 11.0 16.CURSO DE SPSS PRACTICA DE COMPARACIÓN DE MEDIAS 1.0 14.5 23.7 11. alivia más pronto el malestar.5 25.REGRESIÓN LINEAL SIMPLE Lic.5 8. a 9 sujetos se les administro la aspirina de lenta absorción una vez al día durante 3 semanas.5 25.8 11.9 11.Con la finalidad de comparar rendimientos parcial y final en el curso de Estadística.0 20.0 10. se divide aleatoriamente en dos grupos a veinte voluntarios.5 10 14 16 12. Las notas fueron: 8 7. hecho con nueces. que la afirmación del competidor es falsa.0 11.0 21.5 14.5 17.6 10.Se tomo una muestra de 14 alumnos que rindieron el examen final del curso de Estadística . Para probar la eficacia de la campaña.5 15.Una aspirina de lenta absorción perdió hace poco parte de su participación en el mercado ante un nuevo competidor.0 9.5 2.5 12.2 10. se midió la frecuencia de las ondas alfa a partir de los electroencefalogramas de las personas. A la compañía productora de la aspirina le gustaría probar que no existe una diferencia significativa entre los dos productos y.9 4.. En otras 3 semanas a esos mismos sujetos se les administro el producto de la competencia... 10.5 13.5 28. En una prueba preliminar. .7 10.8 10. Al terminar el periodo experimental.2 9.0 13..4 11. RAUL RUIZ ARIAS 20 . por lo mismo.Una empresa acaba de terminar una nueva campaña publicitaria a favor de su cereal natural para el desayuno.5 5 16. Se registro el tiempo promedio de que el medicamento tardó en llegar a la corriente sanguínea de cada sujeto 1 2 3 4 5 6 7 8 9 sujeto Aspirina de lenta absorción 16. Los resultados son los siguientes: Grupo A 10. mientras que los individuos del grupo B sirvieron como grupo control. 3.4 Grupo B 11.5 24.0 Competidor ¿hay diferencia significativa en el tiempo que los medicamentos tardan en llegar a la corriente sanguínea? I .5 10.5 9 19 17 11. el gerente entrevisto a 11 clientes antes de iniciarla y otros 11 después de finalizarla.¿ La privación sensorial tiene algún efecto sobre la frecuencia de las ondas alfa de las personas? Para responder a la pregunta.5 12. Las notas obtenidas fueron las siguientes: PARCIAL 15.5 18 17 Pruebe que el rendimiento de la clase fue el mismo en la evaluación parcial y final. Los individuos del grupo A se sometieron a un periodo de privación sensorial durante 10 días.1 11.5 14.9 10.2 10. A continuación se da el consumo semanal(en onzas) del cereal por parte de los clientes: ANTES DESPUES 14 5 18 18 30 10 8 26 13 24 23 14 13 29 33 11 12 25 21 34 29 26 ¿Puede el gerente afirmar que la campaña ha conseguido incrementar la demanda del cereal? 5.5 18.4 10. en consecuencia..0 11.0 15.1 10. Este anuncia en su publicidad que su marca penetra en la corriente sanguínea más rápidamente que la aspirina de absorción lenta y. trigo y frutas secas.

De manera equivalente. partiendo de una muestra de tamaño n. Y1) . no aleatoria(X). que representan nuestra intención de extraer para cada xi un individuo de la población o variable Yi .CURSO DE SPSS La Regresión lineal simple tiene como objeto estudiar cómo los cambios en una variable.(a + b xi) es el error o desviación aleatoria de Yi ESTIMACIÓN DE LOS PARÁMETROS DE LA RECTA DE REGRESIÓN. .. denominado de los mínimos cuadrados. SOLUCION En el SPSS.cm) y los pesos(Y. Las estimaciones de los parámetros de la recta de regresión obtenidas con este procedimiento son: b= ∧ ∑ (x i =1 n n i − x)( y i − y ) i ∑ (x i =1 a = y −b x ∧ ∧ − x) 2 donde x e y son los promedios muestrales y = a + b x = y + b ( x − x) ∧ ∧ ∧ ∧ Por tanto la recta de regresión estimada será: EJEMPLO: Los datos de la siguiente tabla representan las estaturas (X. donde Ei = Yi . RAUL RUIZ ARIAS 21 . otra formulación del modelo de regresión lineal simple sería: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde.. (xn.5 57. n pares (x1.5 54. (x2. Yn). es decir. se debe seguir los siguientes pasos: Graphs(Gráficos) -> Scatter (Dispersión) ->Simple -> Define( Definir) EJE X: estatura EJE Y: pesos Lic. X “estatura” 152 155 152 155 157 152 157 165 162 178 183 178 Y “peso” 50 61. afectan a una variable aleatoria (Y). kg) de una muestra de 10 adultos. permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Y2).. entonces Yi = a + b xi + Ei . El método de estimación aplicable en regresión. El primer problema es obtener los estimadores de los parámetros de la recta de regresión. es decir.5 59 61 72 66 72 84 82 Realizar el grafico de dispersión y el análisis de los datos. en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal. para el grafico de dispersión de datos. su representación gráfica es una línea recta.5 63.

Variable dependiente: PESOS Modelo Ajustado: y= . .8105 Modelo 1 R . ESTATURA b. -75.076 Sig. ESTATURA ANOVA b Modelo 1 Suma de cuadrados 1061. Todas las variables solicitadas introducidas b. de la estimación 3.520 F 73. Variable dependiente: PESOS Resumen del modelo R cuadrado .868 .052 14.443+0.052 145.250 gl 1 10 11 Media cuadrática 1061.CURSO DE SPSS GAFICO DE DISPERSION 90 80 70 60 50 PESOS 40 150 160 170 180 190 ESTATURA Para el analizar si los datos se ajustan a una línea recta: Analyze (Analizar) -> Regresión(Regresión) -> Linear( Lineal) Dependiente : pesos Independiente : estaturas b Variables introducidas/eliminadas Modelo 1 Variables introducidas a ESTATURA Variables eliminadas .938 a a.198 1206. RAUL RUIZ ARIAS 22 . Variables predictoras: (Constante). Método Introducir a.938 Modelo 1 (Constante) ESTATURA Coeficientes no estandarizados B Error típ.868X Coeficiente de correlación: r = 0. Variable dependiente: PESOS Coeficientesa Coeficient es estandari zados Beta .75.495 .000 a.000 a Regresión Residual Total a.548 Sig.443 16.001 . Variables predictoras: (Constante).938 Lic.880 R cuadrado corregida .101 t -4.574 8.868 Error típ. .

4 28 0. RAUL RUIZ ARIAS 23 .2 34 1. Registró los datos correspondientes a los últimos 7 meses y encontró lo siguiente: Gastos mensuales en carteles( x 1000 soles) Ingresos mensuales por ventas ( x 105 soles) 3.8 27 0.5 27 0.3 33 1. se obtuvieron los siguientes datos en una muestra de 14 individuos 46 X 18 21 28 35 47 33 40 41 28 21 44 38 30 38 40 47 54 66 52 59 60 47 40 63 57 49 65 Y e) Calcule el valor estimado para la concentración media en el plasma cuando el componente X mide 20 unidades.4 35 1. nuevos productos y técnicas de publicidad se han utilizado durante este tiempo. por lo cual es difícil determinar cuales de esos factores tienen la mayor influencia en las ventas.0 35 1. Una cadena de tiendas de repostería ha tenido grandes fluctuaciones en sus ingresos durante los últimos años. 25 38 16 40 42 47 34 54 10 66 21 52 19 59 Los datos siguientes fueron reunidos como parte de un estudio en el que los sujetos eran niños prematuros con bajo peso Tiempo de gestación(semanas) Peso al nacer(Kg) Tiempo de gestación(semanas) Peso al nacer(Kg) 30 1.3 29 1.CURSO DE SPSS PRACTICA DE REGRESIÓN Para cada uno de los siguientes ejercicios: a) b) c) d) 1.8 26 0. Abundantes ofertas. Elabore un diagrama de dispersión Calcule e interprete el coeficiente de correlación en la muestra Mediante una prueba de hipótesis ¿Se puede afirmar que en la población.1 32 1.9 32 1.7 36 1. El departamento de mercadotecnia ha estudiado varias relaciones y piensa que los gastos mensuales destinados a carteles pueden ser significativos.2 31 1. las dos variables están correlacionadas? Obtenga la ecuación de regresión y grafíquela en el diagrama de dispersión En un estudio del efecto de un componente X de la dieta sobre la composición de los lípidos del plasma(Y).5 33 1.2 Lic.4 30 1.8 27 1. 2.0 32 1.

¿Podemos concluir. se calcula a partir de la distribución estudiada.CURSO DE SPSS IV . si X2 calc < X2 tab Se rechaza la Ho si X2 calc > X2 tab Prueba Chi .04 1 Datos esperados 320 40 24 16 400 Lic.cuadrado Componentes de la fórmula o estadístico de prueba: Oi = Frecuencia observada o empírica ei = Frecuencia teórica o esperada k = Número de clases o categorías que se analizan m = Número de parámetros estimados en base a los datos primarios y que se usan en la determinación de ei. normal. El Departamento de Psicología. Paso 2. un 6% reprobó todas las materias y un 4% se retiro. 49 aprobaron la mitad. Ello se logra generalmente combinando intervalos sucesivos. basándose en informaciones anteriores. Criterios de decisión: Se acepta la Ho. un 10% aprobó la mitad. Al final del semestre pasado el departamento selecciono a 400 alumnos. exponencial. que la información del semestre antepasado se ha vuelto a repetir el semestre pasado? Hipótesis nula: de que los porcentajes del semestre pasado son los mismos que en el semestre antepasado.178 Datos observados 287 49 30 34 400 Probabilidad 0. Atributos Aprobó todo Aprobó la mitad Reprobó todo Se retiró Total χ2 = 27. Ho : La variable en estudio se ajusta a determinada distribución teórica (Uniforme. la frecuencia teórica para cada clase. Ejemplo 3. Establecimiento del nivel de significación o error tipo I. Paso 3.. resultado 287 aprobaron todas las asignaturas. al final del semestre antepasado.Como regla práctica se recomienda que la frecuencia teórica esperada en cualquier intervalo no sea menor que 5. 30 reprobaron todas las asignaturas y 34 se retiraron. Nota .80 0. RAUL RUIZ ARIAS 24 .06 0. el 80% de los alumnos aprobaron todas las materias inscritas. poisson).10 0. siendo ei. Ha : La variable en estudio tiene un comportamiento aleatorio que no se ajusta a determinada distribución teórica. a raíz de los resultados. Cálculos previos y estimación de la frecuencia esperada o teórica Paso 4. – Prueba Chi cuadrado Paso 1.

RAUL RUIZ ARIAS 25 . identificar las variables con las que trabajaremos Ponderando la base de datos Lic.10 0.04 1 Datos esperados 320 40 24 16 400 En la ventana vista de variables. Conclusión: Los porcentajes no se repitieron el semestre pasado Usando el SPSS 1.84 Como 27.80 0.06 0..CURSO DE SPSS Como tenemos 4 categorías y ningún parámetro estimado los grados de libertad serán: 4-1= 3 χ 02.84 se rechaza la hipótesis nula.3 = 12.05.178 es mayor que 12.Definir las variables de estudio Se tiene la siguiente información: Atributos Aprobó todo Aprobó la mitad Reprobó todo Se retiró Total Datos observados 287 49 30 34 400 Probabilida d 0.

encontramos: y clic en “Aceptar” Realizar la prueba Chi-Cuadrado (prueba de bondad de ajuste) Lic.CURSO DE SPSS Encontramos la siguiente ventana: Marcar frecuencias (variable a ponderar). RAUL RUIZ ARIAS 26 . marcar “Ponderar casos mediante”.

asintót. La frecuencia de casilla esperada mínima es 16.0 9.000 < 0. atributo 27.0 Estadísticos de contraste a Chi-cuadrado gl Sig.000 a.0 6.0 Residual -33.05 .- Lic.0 18.0 40. la muestra tiene datos que no corresponden a la población.0%) tienen frecuencias esperadas menores que 5. Problema 4.0 24. El valor de Sig=0.178 3 . RAUL RUIZ ARIAS 27 . 0 casillas (.0.CURSO DE SPSS y clic en “Aceptar” atributo Aprobó todo Aprobó la mitad Reprobó todo se retiro Total N observado 287 49 30 34 400 N esperado 320.0 16.

- Lic.CURSO DE SPSS Problema 5. RAUL RUIZ ARIAS 28 .

Sign up to vote on this title
UsefulNot useful