Está en la página 1de 28

CURSO DE SPSS

SPSS I . - INTRODUCCIN AL SPSS


1.- MENU PRINCIPAL .- La versin del SPSS que estudiaremos es la 12.0,
en ella se puede observar un men principal que la podemos describir de la siguiente manera: Archivo. Edicin. Mediante este men se pueden abrir, crear o grabar los diferentes ficheros que SPSS emplea. Igualmente, es posible controlar las tareas de impresin. Permite realizar las tareas habituales de edicin: modificar, borrar, copiar, pegar, seleccionar etc. Ver. Permite controlar diversos parmetros de visualizacin en pantalla. datos: seleccionar, aadir, ponderar, etc. Transformar.

Datos. Este men permite definir variables, as como efectuar modificaciones en los ficheros de

Aqu se encuentran todas las opciones relativas a la modificacin y generacin


de nuevas variables. Las funciones de este men y del anterior son temporales, y solo estn vigentes durante la sesin, sin que afecten al fichero original de datos.

Analizar. Grficos. Utilidades.

Mediante este men se accede a los diferentes anlisis estadsticos que se hayan instalado. Permite la creacin y edicin de diversos tipos de grficos de alta resolucin. Entre otras, posibilita mostrar informacin sobre los ficheros de SPSS, las variables o el tratamiento de conjuntos de variables. Dispone de las funciones habituales para controlar las ventanas. Proporciona ayuda al usuario en el formato tpico de Windows.

Ventana ?

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS

2.- Para grabar un archivo de datos


Paso 1: Ir al men principal y seleccionar Archivo Paso 2 : Seleccionar Guardar como

Paso 3. Encontramos el siguiente cuadro:

Guardar en .- podemos seleccionar en que carpeta grabaremos el archivo de datos (debemos crear la carpeta trabajo donde guardaremos nuestros archivos) Nombre.- En este cuadro ingresaremos el nombre del archivo de datos.

Paso 4 : Presionar el botn Guardar. Observaciones Se debe tener cuidado de no tener otro archivo con el mismo nombre. Si el archivo ya fue grabado anteriormente, no es necesario ir a la opcin grabar como , en este caso seleccionar el botn grabar, y los cambios que hemos realizado se grabaran en este archivo.

En la barra de herramienta, una forma rpida de grabar, si el archivo ya existe, es presionar en el icono: Cuando se trabaja con el SPSS, se genera un archivo que contienen los resultados de las operaciones realizadas, estos archivos se conocen como Output, el procedimiento para grabarlos es similar a los archivos de datos.

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS

3.- DEFINICIN DE LAS VARIABLES DE LA MATRIZ


1. Seleccione la primera variable a trabajar y en la esquina inferior izquierda seleccione
Vista de variables.

2. SPSS exige que se asigne un nombre a cada variable con la finalidad de identificar
correctamente los diferentes conjuntos de datos. La extensin mxima de los nombres es de 8 caracteres.

3. Es indiferente usar maysculas o minsculas, pero debe iniciar con una letra. 4. Hay una serie de palabras claves que tienen un significado especial para SPSS, y en
consecuencia, no se pueden usar como nombres de variables. Ejemplos: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO, WITH. 3.1.- TIPO DE VARIABLES EN SPSS (TYPE) Las variables que configuran una matriz de datos permiten distinguir entre variables cuantitativas y cualitativas, de forma que la codificacin numrica es la que corresponde a las variables cuantitativas, y la alfanumrica la que mejor se adapta a las cualitativas. Al presionar en el botn Tipo obtendrs lo siguiente:

Numrica. Admite cualquier nmero, puede ir precedido del signo ms o del menos. Su longitud mxima es de 40 caracteres de los cuales 16 pueden ser cifras decimales. As para las variables numricas enteras cuyos valores oscilan entre 0 y 20 se puede ingresar: ancho 2 y cifras decimales 0. Fecha. Permite formatos para fecha Dlar. Le aade el smbolo del dlar en los diferentes formatos que aparecen en la ventana que se despliega caso de elegir esta opcin. Cadena. Admiten cualquier carcter, en su definicin debe especificarse nicamente su longitud mxima.

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS 3.2.- Etiquetas de valor (Valores)

En primer lugar, en el cuadro correspondiente a Valor, se teclea el cdigo del valor de la variable. A continuacin, el texto de la etiqueta en el cuadro correspondiente a Etiqueta de valor finalmente, se pulsa el botn Aadir, con lo que la correspondencia entre el valor y la etiqueta queda incorporada a la lista. El proceso se repite con todos los valores de la variable que se quieran etiquetar. Una vez acabado el proceso, se pulsa el botn Aceptar.. Ejemplo 1 .- El siguiente ejemplo nos permitir observar como se ingresan datos al SPSS, Asumamos que tenemos el siguiente grupo de personas: Hombre, Hombre, Hombre, Hombre, Hombre, Hombre, Mujer, Mujer, Mujer, Mujer Pasos para ingresar datos al SPSS: Paso 1.- al ingresar los datos al SPSS se debe codificar la informacin para que sea ms fcil su anlisis, en este caso Hombre es 1 y mujer es 0, guardar el archivo con el nombre Ejemplo_1 en nuestra carpeta de trabajo.

Paso 2.- En la opcin Vista de variables se debe identificar la variable en estudio:

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS
Nombre de la variable Tipo Ancho Decimales : : : : sexo numrico 2 dgitos sin decimales

En la opcin Valores

Nuestro archivo queda de la siguiente manera:

Paso 3.- Que pasa si nos interesa resumir nuestra informacin? En el men principal: Analizar => Estadsticos descriptivos => Frecuencias

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS
al hacer clic en la flecha

Hacer clic en Aceptar


sexo Frecuencia 4 6 10 Porcentaje 40.0 60.0 100.0 Porcentaje vlido 40.0 60.0 100.0 Porcentaje acumulado 40.0 100.0

Vlidos

mujer hombre Total

4.- Como abrir o recuperar un archivo de SPSS


Paso 1: Ir al men principal y seleccionar Archivo Paso 2 : Seleccionar Abrir

Paso 3. Encontramos el siguiente cuadro:

Seleccionar el archivo que se desea abrir.

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS
Ejemplo de tabulacin de datos.- Se tiene la siguiente informacin sobre la edad de 10 pacientes: 8 12 23 11 9 10 15 20 11 27

Se desea clasificar la informacin en una tabla de frecuencias, basndose en los siguientes rangos de edad: Primer grupo : Segundo grupo : Tercer grupo : Pasos: 1.- Ingresar la informacin en un archivo de datos, creando la variable Edad 2.- En el men principal: de 1 a 10 aos de 11 a 20 aos de 21 a 30 aos.

Transformar => Recodificar En Distintas Variables (los resultados van a una variable diferente)

Se ingresa el nombre del archivo de salida, presionar Cambiar

3.- Presionar el botn Valores antiguos y nuevos, nos sale el siguiente cuadro:

4.- En el cuadro anterior: Primero, en Rango ingresar 1 hasta 10, => en valor ingresar 1, => presionar Aadir luego, en Rango ingresar 11 hasta 20 => en valor ingresar 2, => presionar Aadir finalmente, en Rango ingresar 21 hasta 30 =>en valor ingresar 3, =>presionar Aadir presionar Continuar, luego Aceptar

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS

5.- Hemos construido la variable rango, en la parte inferior izquierda de la pantalla presionar Vista de Variables, en esta ventana en la opcin Valores :

en Valor ingresar 1 en Etiqueta de valor 01 -10, presionar Aadir en Valor ingresar 2 en Etiqueta de valor 11 -20, presionar Aadir en Valor ingresar 3 en Etiqueta de valor 21 -30, presionar Aadir, Aceptar

6.- Luego: en el men principal ir a: Analizar, Estadista Descriptiva, Frecuencias, seleccionar la variable Rango y Aceptar.
RANGO Frequency 3 5 2 10 Percent 30.0 50.0 20.0 100.0 Valid Percent 30.0 50.0 20.0 100.0 Cumulative Percent 30.0 80.0 100.0

Valid

01 - 10 11 - 20 21 - 30 Total

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS
Grficos Grafico de sectores Con el ejemplo ejemplo_1.sav, ir al men principal, seleccionar Grficos, luego sectores:

Presionar definir, luego encontramos la siguiente ventana:

Seleccionar la variable de inters, en este caso la variable sexo y presionar de la opcin Definir sectores por, encontramos la siguiente ventana:

Presionar Aceptar, encontramos el siguiente grafico:

Lic. RAUL RUIZ ARIAS

CURSO DE SPSS

Es posible editar el grfico presionando dos veces con el mouse en el grfico para abrir el editor de grficos:

Lic. RAUL RUIZ ARIAS

10

CURSO DE SPSS

II. - ANLISIS DESCRIPTIVO


2.1.- INTRODUCCIN
Clasificacin segn el tipo de variables:

VARIABLES CUALITATIVAS EN ESCALA NOMINAL.- Son variables cuyos elementos toman valores no numricos con ausencia de orden entre ellos

Ejemplos: Estados civil, Sexo, Deporte que practica, Profesin, Lugar de nacimiento

VARIABLES CUALITATIVAS EN ESCALA ORDINAL.- Son aquellas variables cuyos elementos toman valores no numricos con presencia de orden entre ellos

Ejemplo Grado de instruccin, Clase social, Orden de merito, Grado de agresividad

VARIABLES CUANTITATIVAS.-

Son aquellas variables elementos toman

valores numericos.

2.2.- ANLISIS DESCRIPTIVO CON SPSS


El primer paso en el anlisis de datos, una vez introducidos los mismos, es realizar un anlisis descriptivo de la muestra. Este anlisis nos permitir controlar la presencia de posibles errores en la fase de introduccin de los datos, es decir, detectaremos con l valores fuera de rango (p. ej. un peso de 500 Kg es claramente un dato extrao), o la presencia de valores perdidos. Este anlisis inicial tambin nos proporcionar una idea de la forma que tienen los datos: su posible distribucin de probabilidad con sus parmetros de centralizacin; media, mediana y moda; as como sus parmetros de dispersin; varianza, desviacin tpica, etc El SPSS proporciona varias herramientas para realizar esta descripcin, todas ellas bajo el men Analizar (Analyze) y, dentro de l, la opcin Estadsticos descriptivos (Descriptive Statistics). Estos procedimientos son: Frecuencias, Descriptivos y Explorar 2.2.1.- PROCEDIMIENTO FRECUENCIAS La ejecucin de este procedimiento resulta en un gran nmero de resultados grficos y de tablas con informacin numrica. Una vez decidida(s) la(s) variable(s) a analizar, se solicitan los estadsticos y las grficas que queremos obtener. La eleccin de los estadsticos depender del tipo de variable a analizar. En el caso de variables cuantitativas tiene sentido la solicitud de estadsticos de centralizacin, dispersin y forma de la distribucin, mientras que para el caso de variables cualitativas esto no tiene sentido. En este segundo caso, el inters se centrar en la obtencin de la tabla de frecuencias.

Lic. RAUL RUIZ ARIAS

11

CURSO DE SPSS
Las tablas de frecuencias pueden ordenarse segn el valor de la variable o segn las frecuencias observadas. Para aquellas variables con un gran nmero de valores diferentes se puede optar por suprimir dicha tabla. 2.2.2.- PROCEDIMIENTO DESCRIPTIVOS De forma similar al anterior procedimiento de frecuencias, aunque algo ms limitado pues no cuenta con la posibilidad de generar grficas, el procedimiento Descriptivos genera descripciones numricas de las variables cuantitativas (media, desviacin, varianza, etc.). 2.2.3.- PROCEDIMIENTO EXPLORAR Aunque la presentacin de este procedimiento se ha dejado para el final, su lugar debera ser preponderante sobre los anteriores. A excepcin de las tablas de frecuencias, que slo es posible obtenerlas a travs del procedimiento frecuencias, mediante Explorar, se puede obtener el resto de resultados antes expuestos. Dentro del procedimiento Explorar se puede solicitar el clculo de distintos estadsticos y la generacin de distintas grficas. 2.2.4.- PROCEDIMIENTO GRFICOS Adems de las grficas producidas por los anteriores procedimientos descriptivos, el SPSS cuenta con un men dedicado expresamente a la produccin de resultados grficos. Sirvan estas notas como una breve exposicin de las caractersticas generales en el manejo de los procedimientos grficos. El procedimiento estndar de generacin de grficos se inicia con la eleccin de Graphs del men principal y del tipo de grfico deseado. Tras esta eleccin el programa solicita mayor informacin acerca de las caractersticas del grfico deseado. Esto generalmente se realiza a travs de un cuadro de dilogo especfico, en este caso relativo a un grfico de barras.

Una vez confirmada la definicin del grfico mediante el correspondiente botn de aceptar, en el visor de resultados aparece el grfico creado. Seleccionndolo con el Mouse y pulsando dos veces sobre el mismo se abre el editor de grficos

Lic. RAUL RUIZ ARIAS

12

CURSO DE SPSS

2.3.- EJEMPLOS APLICATIVOS


Ejemplo 1: Variable NOMINAL
Estudiaremos el efecto de un frmaco del que se sabe aumenta el ndice cardiaco en pacientes con Shock. Para comprobarlo, se administrar el frmaco a un grupo de 103 pacientes (archivo: 1_tshock). Antes de proceder al estudio, se desea una descripcin del grupo de estudio. La variable Tipo de Shock, Identificado como TSHOCK, se puede clasificar como: Hipovolemico Cardiogenico Distributivo Obstructivo La variable TSHOCK toma valores no numricos que describen cualidades, las cuales no presentan ningn orden natural. Esta variable corresponde al tipo cualitativo y la medida de sus posibles valores es nominal. Para poder crear la tabla de distribucin de frecuencia de la variable, se puede seguir los pasos que se presentan en el siguiente cuadro de dialogo:

Analyse -> Descriptive Statistics-> Frequencies Seleccionar la Variable: Tipo de Shock(TSHOCK), luego Estadstico a evaluar: Statistics -> mode Graficos: Charts -> Bar Charts Frequencies (el eje y son frecuencias) OK (enter)
RESULTADOS:
Statistics Tipo de shock N Valid Missing Mode 103 0 2

Tipo de shock Frequency 27 35 29 12 103


T o de sh ip ock
4 0

Valid

Hipovolmico Cardiognico Distributivo Obstructivo Total

Percent 26.2 34.0 28.2 11.7 100.0

Valid Percent 26.2 34.0 28.2 11.7 100.0

Cumulative Percent 26.2 60.2 88.3 100.0

3 0

2 0

Frequency

1 0

0 H o l ic ip vo m o C rd g nic a io o D trib is utivo O s tivo b truc

Tipo de shock

Lic. RAUL RUIZ ARIAS

13

CURSO DE SPSS

Ejemplo 2: Variable ORDINAL


Se desea estudiar el efecto de un tratamiento en pacientes con cncer de colon, se sospecha que dicho efecto es distinto segn el grado de Extensin del cncer. Se aplica el tratamiento a un grupo de pacientes, durante un periodo, se analizar su efecto considerando el grado de Extensin del cncer al inicio del tratamiento. Por lo tanto, antes de proceder al estudio, se realizara una Anlisis del grupo de estudio. La variable Grado de Extensin del cncer ( identificado como CANCER) segn la clasificacin modificada del carcinoma de colon de Duke, Asume los siguientes valores: Limitado por mucosa(A) Extensin muscular propia sin penetrar en ella y sin afectar a ganglios(B1) A travs de toda la pared, sin afectar a ganglios(B2) Limitada a pared con ganglios afectados(C1) A travs de todas las capas de la pared con ganglios afectados(C2)

Es decir, la variable CANCER toma valores no numricos que describen cualidades, adems presentan un orden natural (de menor a mayor Extensin) Utilizando el archivo 2_cancer, debe seguir los siguientes pasos:

Analyse => Descriptive Statistics => Frequencies Seleccionar la Variable => Grado de Statistics del cncer(CANCER) extensin Estadsticos: Statistics Gradomode Median => de extensin del cncer N Valid quartiles 112 Missing Formato de salida: Format => Ascending Values (ordenar valores ascendentes) 0 Median OK(enter) 2.00
RESULTADOS:
Mode 1

Grado de extensin del cncer Frequency 43 28 17 14 10 112 Percent 38.4 25.0 15.2 12.5 8.9 100.0 Valid Percent 38.4 25.0 15.2 12.5 8.9 100.0 Cumulative Percent 38.4 63.4 78.6 91.1 100.0

Valid

A B1 B2 C1 C2 Total

PRACTICA

Lic. RAUL RUIZ ARIAS

14

CURSO DE SPSS
1.- Realizar un estudio descriptivo de la normalidad para la variable ndice cardiaco(IC), los datos se encuentran en el archivo: 3_ndice cardiaco Pasos:

Analyze => Descriptive Statistics => Frequencies Variable : ndice cardiaco(IC) Estadsticos(Statistics) : Valores percentiles: percentile(s): 2.5 16 84 97.5 Add, continue Grficos( Charts) : tipo de Grafico: Histograma (Histograms) Con curva Normal (with normal curve), continue Desmarcar : mostrar Tabla de frecuencias(Display frequency tables) ACEPTAR
Statistics ndice cardaco (l/m2) N Valid Missing Percentiles 2.5 16 84 97.5 111 0 1.0689 1.6076 4.0029 6.8176

ndice cardaco (l/m2)


16 14 12 10 8 6

Frequency

4 2 0 Std. Dev = 1.30 Mean = 2.94 N = 111.00


25 7. 75 6. 25 6. 75 5. 25 5. 75 4. 25 4. 75 3. 25 3. 75 2. 25 2. 75 1. 25 1. 5 .7

ndice cardaco (l/m2)

Lic. RAUL RUIZ ARIAS

15

CURSO DE SPSS

III . - COMPARANDO MEDIAS O PROMEDIOS


Dentro del men Analyze, la opcin Compare Means (comparar medias) permite realizar comparaciones de medias en distintas situaciones Prueba t para una muestra Prueba t para muestras independientes Prueba t para muestras relacionadas

3.1.- PRUEBA T DE STUDENT DE 1 MUESTRA.- Para contrastar si la media de una


poblacin difiere significativamente de un valor dado, el contraste indicado es la Prueba T para una muestra. En el Cuadro de dialogo correspondiente se debe introducir la variable a analizar y el valor de la media con el que se quiere comparar. EJEMPLO: Supngase que se sospecha que un tratamiento para la artrosis puede producir descenso en las cifras de hemoglobina plasmtica en los hombres. Para comprobarlo se aplica un tratamiento sobre un conjunto de 100 hombres con artrosis, antes de ser sometidos al tratamiento, se miden sus niveles de hemoglobina, obtenindose que siguen una distribucin Normal de media igual a 15. Al cierre del estudio nicamente se conoce el resultado del tratamiento en 70 pacientes, se desea comprobar que los resultados de la muestran coinciden con los de la poblacin original, para ello se aplicara una prueba t de student para una muestra. Solucin. Hiptesis nula: El promedio de los niveles de hemoglobina es 15 H0: =15 H0: <15

Hiptesis nula: El promedio de los niveles de hemoglobina es menor que 15 Archivo: 4_hemoglobina_inicial, pasos

Analyze => Compare Means => One sample T test (Prueba T para una muestra) Test Variable (Contrastar variables): Hemoglobina inicial (hbi) Test Value (Valor de prueba) : 15 Aceptar
One-Sample Statistics N Hemoglobina inicial, (gr/100 ml) 70 Mean 14.9954 Std. Deviation .53566 Std. Error Mean .06402

Lectura de esta tabla: N=70 : en la muestra hay 70 datos el promedio aritmtico de los datos es 14.9954 La desviacin estndar ( raz cuadrada de la varianza) es Mean=14.9954 : 0.53566

Std Deviation= 0.53566 :

Lic. RAUL RUIZ ARIAS

16

CURSO DE SPSS
O ne-Sample Test Test Value = 15 95% Confidence Interval of the Difference Lower Upper -.1323 .1231

t Hemoglobina inicial, (gr/100 ml) -.072

df 69

Sig. (2-tailed) .943

Mean Difference -.0046

En el caso bilateral sig=0.943 se compara con =0.05,como el sig resulto mayor que se acepta H0: =15

Sig/2
-3 -2 -1 0

Sig/2
1 2 3

Para nuestro ejemplo es el caso unilateral (H1: <15), el valor de sig del cuadro debe ser dividido entre 2 para poder compararlo con =0.05, como el sig/2=0.943/2=0.4715 resulto mayor que se acepta H0: =15

Sig/2
-3 -2 -1 0 1 2 3

PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES Esta opcin debe utilizarse cuando la comparacin se realice entre las medias de dos poblaciones independientes (los individuos de una de las poblaciones son distintos a los individuos de la otra) como por ejemplo en el caso de la comparacin de las poblaciones de hombres y mujeres. La matriz de datos debe estar configurada, es decir, existe una columna para los datos de la variable de inters y una segunda columna con los cdigos que definen las poblaciones objeto de comparacin. Para el anlisis, en el cuadro de dialogo correspondiente debemos configurar el campo relativo a la variable de agrupacin y posteriormente se deben definir los grupos a comparar mediante el botn definir. Esta operacin sustituir los signos de interrogacin que aparecen en la casilla de la variable de agrupacin por los cdigos de los grupos comparados.

Lic. RAUL RUIZ ARIAS

17

CURSO DE SPSS
EJEMPLO: En un estudio de factores que se consideran responsables de los efectos adversos del tabaquismo sobre la reproduccin humana, se midieron los niveles de cadmio(nanogramos por gramo) en el tejido de la placenta de una muestra de 14 mujeres embarazadas que fumaban y una muestra aleatoria independiente de 18 mujeres no fumadoras. Los resultados fueron los siguientes: Fumadoras No 30 30.1 15 24.1 30.5 17.8 16.8 14.8 13.4 28.5 17.5 14.4 12.5 20.4

10 8.4 12.8 25 11.7 9.8 12.5 15.4 23.5 9.4 7.5 11.8 12.2 15 25.1 19.5 25.5 9.8 Fumadoras Es posible afirmar que el nivel medio de cadmio registrado sea mayor entre las fumadoras que entre las no fumadoras? SOLUCION.Archivo: 5_niveles_de_cadmio, pasos:

Analizar => Comparar Medias => Prueba T para muestra independientes Contrastar variable : niveles de cadmio (NC) Variable de agrupacin : fuma Definir grupos Grupo 1 : 1 Grupo 2 : 2 continuar Aceptar
Group Statistics FUMA NIVEL DE CADMIO FUMADORA NO FUMADORA N 14 18 Mean 20.4143 14.7167 Std. Deviation 6.81411 6.20145 Std. Error Mean 1.82115 1.46170

Independent Samples Test Levene's Test for Equality of Variances

t-test for Equality of Means 95% Confidence Interval of the Difference Lower Upper .98606 10.409

F NIVEL DE CADMIO Equal variances assumed Equal variances not assumed .456

Sig. .505

t 2.47

df 30

Sig. (2-tailed) .019

Mean Difference 5.6976

Std. Error Difference 2.30702

2.44

26.7

.022

5.6976

2.33519

.90349

10.492

Lic. RAUL RUIZ ARIAS

18

CURSO DE SPSS
PRUEBA T DE STUDENT PARA MUESTRAS RELACIONADAS Existe una segunda alternativa para contrastar dos medias. sta se refiere al supuesto caso en el que las dos poblaciones no sean independientes, es decir, el caso en el que se trate de poblaciones relacionadas. Esta situacin se encuentra, por ejemplo, en los diseos apareados, diseos en los que los mismos individuos son observados antes y despus de una determinada intervencin o en los diseos en los que las muestras son emparejadas de acuerdo a una serie de variables para controlar su efecto (como por ejemplo en los diseos de casos y controles). Para la realizacin de este anlisis, las dos muestras deben estar en dos variables distintas de la matriz de datos y debe formarse la pareja de muestras antes de poder ser aadida la comparacin a la lista de variables relacionadas. EJEMPLO: Supngase que se sospecha de que un tratamiento para la artrosis puede producir descenso en las cifras de hemoglobina plasmtica en hombres. Para comprobarlo se aplica a una muestra de hombres con artrosis en condiciones normales y despus de un periodo de observacin, se analiza de nuevo la hemoglobina. Como se busca comparar la hemoglobina al inicio y al final del periodo, la prueba que se aplicara es la t de student para dos muestras relacionadas. SOLUCION: Abrir el archivo hemoglobina_inicial_final Variables: hemoglobina inicial(HBI) y hemoglobina Final(HBF)

Analizar => Comparar Medias => Prueba T para muestra relacionadas Variables relacionadas : HBI HBF Aceptar

Lic. RAUL RUIZ ARIAS

19

CURSO DE SPSS
PRACTICA DE COMPARACIN DE MEDIAS 1.- Se tomo una muestra de 14 alumnos que rindieron el examen final del curso de Estadstica . Las notas fueron: 8 7.5 11.5 12.5 10 14 16 12.5 14.5 5 16.5 8 10 FINAL Pruebe la hiptesis de que la nota final promedio de la clase fue por lo menos 13. 10.5

2.- Con la finalidad de comparar rendimientos parcial y final en el curso de Estadstica, se tom una muestra de 11 alumnos que rindieron el examen parcial. Las notas obtenidas fueron las siguientes: PARCIAL 15.5 14.5 9 19 17 11.5 13.5 8.5 10.5 18 17 Pruebe que el rendimiento de la clase fue el mismo en la evaluacin parcial y final. 3.- La privacin sensorial tiene algn efecto sobre la frecuencia de las ondas alfa de las personas? Para responder a la pregunta, se divide aleatoriamente en dos grupos a veinte voluntarios. Los individuos del grupo A se sometieron a un periodo de privacin sensorial durante 10 das, mientras que los individuos del grupo B sirvieron como grupo control. Al terminar el periodo experimental, se midi la frecuencia de las ondas alfa a partir de los electroencefalogramas de las personas. Los resultados son los siguientes: Grupo A 10.2 9.5 10.1 10.0 9.8 10.9 11.4 10.8 9.7 10.4 Grupo B 11.0 11.2 10.1 11.4 11.7 11.2 10.8 11.6 10.9 10.9 4.- Una empresa acaba de terminar una nueva campaa publicitaria a favor de su cereal natural para el desayuno, hecho con nueces, trigo y frutas secas. Para probar la eficacia de la campaa, el gerente entrevisto a 11 clientes antes de iniciarla y otros 11 despus de finalizarla. A continuacin se da el consumo semanal(en onzas) del cereal por parte de los clientes: ANTES DESPUES 14 5 18 18 30 10 8 26 13 24 23 14 13 29 33 11 12 25 21 34 29 26

Puede el gerente afirmar que la campaa ha conseguido incrementar la demanda del cereal? 5.- Una aspirina de lenta absorcin perdi hace poco parte de su participacin en el mercado ante un nuevo competidor. Este anuncia en su publicidad que su marca penetra en la corriente sangunea ms rpidamente que la aspirina de absorcin lenta y, por lo mismo, alivia ms pronto el malestar. A la compaa productora de la aspirina le gustara probar que no existe una diferencia significativa entre los dos productos y, en consecuencia, que la afirmacin del competidor es falsa. En una prueba preliminar, a 9 sujetos se les administro la aspirina de lenta absorcin una vez al da durante 3 semanas. En otras 3 semanas a esos mismos sujetos se les administro el producto de la competencia. Se registro el tiempo promedio de que el medicamento tard en llegar a la corriente sangunea de cada sujeto 1 2 3 4 5 6 7 8 9 sujeto Aspirina de lenta absorcin 16.5 25.5 23.0 14.5 28.0 10.0 21.5 18.5 15.5 12.0 20.5 25.0 16.5 24.0 11.5 17.0 15.0 13.0 Competidor hay diferencia significativa en el tiempo que los medicamentos tardan en llegar a la corriente sangunea?

I . - REGRESIN LINEAL SIMPLE

Lic. RAUL RUIZ ARIAS

20

CURSO DE SPSS
La Regresin lineal simple tiene como objeto estudiar cmo los cambios en una variable, no aleatoria(X), afectan a una variable aleatoria (Y), en el caso de existir una relacin funcional entre ambas variables que puede ser establecida por una expresin lineal, es decir, su representacin grfica es una lnea recta. De manera equivalente, otra formulacin del modelo de regresin lineal simple sera: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces Yi = a + b xi + Ei , donde Ei = Yi - (a + b xi) es el error o desviacin aleatoria de Yi

ESTIMACIN DE LOS PARMETROS DE LA RECTA DE REGRESIN. El primer problema es obtener los estimadores de los parmetros de la recta de regresin, partiendo de una muestra de tamao n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn, Yn); que representan nuestra intencin de extraer para cada xi un individuo de la poblacin o variable Yi . El mtodo de estimacin aplicable en regresin, denominado de los mnimos cuadrados, permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Las estimaciones de los parmetros de la recta de regresin obtenidas con este procedimiento son:

b=

(x
i =1 n

x)( y i y )
i

(x
i =1

a = y b x

x) 2

donde

x e y son los promedios muestrales y = a + b x = y + b ( x x)


Por tanto la recta de regresin estimada ser:

EJEMPLO: Los datos de la siguiente tabla representan las estaturas (X,cm) y los pesos(Y, kg) de una muestra de 10 adultos. X estatura 152 155 152 155 157 152 157 165 162 178 183 178 Y peso 50 61.5 54.5 57.5 63.5 59 61 72 66 72 84 82 Realizar el grafico de dispersin y el anlisis de los datos. SOLUCION En el SPSS, para el grafico de dispersin de datos, se debe seguir los siguientes pasos: Graphs(Grficos) -> Scatter (Dispersin) ->Simple -> Define( Definir) EJE X: estatura EJE Y: pesos

Lic. RAUL RUIZ ARIAS

21

CURSO DE SPSS
GAFICO DE DISPERSION
90

80

70

60

50

PESOS

40 150 160 170 180 190

ESTATURA

Para el analizar si los datos se ajustan a una lnea recta: Analyze (Analizar) -> Regresin(Regresin) -> Linear( Lineal) Dependiente : pesos Independiente : estaturas
b Variables introducidas/eliminadas

Modelo 1

Variables introducidas a ESTATURA

Variables eliminadas .

Mtodo Introducir

a. Todas las variables solicitadas introducidas b. Variable dependiente: PESOS

Resumen del modelo R cuadrado .880 R cuadrado corregida .868 Error tp. de la estimacin 3.8105

Modelo 1

R .938 a

a. Variables predictoras: (Constante), ESTATURA


ANOVA b Modelo 1 Suma de cuadrados 1061.052 145.198 1206.250 gl 1 10 11 Media cuadrtica 1061.052 14.520 F 73.076 Sig. .000 a

Regresin Residual Total

a. Variables predictoras: (Constante), ESTATURA b. Variable dependiente: PESOS

Coeficientesa Coeficient es estandari zados Beta .938

Modelo 1

(Constante) ESTATURA

Coeficientes no estandarizados B Error tp. -75.443 16.495 .868 .101

t -4.574 8.548

Sig. .001 .000

a. Variable dependiente: PESOS

Modelo Ajustado: y= - 75.443+0.868X Coeficiente de correlacin: r = 0.938

Lic. RAUL RUIZ ARIAS

22

CURSO DE SPSS

PRACTICA DE REGRESIN Para cada uno de los siguientes ejercicios: a) b) c) d) 1. Elabore un diagrama de dispersin Calcule e interprete el coeficiente de correlacin en la muestra Mediante una prueba de hiptesis Se puede afirmar que en la poblacin, las dos variables estn correlacionadas? Obtenga la ecuacin de regresin y grafquela en el diagrama de dispersin En un estudio del efecto de un componente X de la dieta sobre la composicin de los lpidos del plasma(Y), se obtuvieron los siguientes datos en una muestra de 14 individuos 46 X 18 21 28 35 47 33 40 41 28 21 44 38 30 38 40 47 54 66 52 59 60 47 40 63 57 49 65 Y e) Calcule el valor estimado para la concentracin media en el plasma cuando el componente X mide 20 unidades. 2. Una cadena de tiendas de repostera ha tenido grandes fluctuaciones en sus ingresos durante los ltimos aos. Abundantes ofertas, nuevos productos y tcnicas de publicidad se han utilizado durante este tiempo, por lo cual es difcil determinar cuales de esos factores tienen la mayor influencia en las ventas. El departamento de mercadotecnia ha estudiado varias relaciones y piensa que los gastos mensuales destinados a carteles pueden ser significativos. Registr los datos correspondientes a los ltimos 7 meses y encontr lo siguiente: Gastos mensuales en carteles( x 1000 soles) Ingresos mensuales por ventas ( x 105 soles) 3. 25 38 16 40 42 47 34 54 10 66 21 52 19 59

Los datos siguientes fueron reunidos como parte de un estudio en el que los sujetos eran nios prematuros con bajo peso Tiempo de gestacin(semanas) Peso al nacer(Kg) Tiempo de gestacin(semanas) Peso al nacer(Kg) 30 1.4 28 0.8 27 0.9 32 1.5 33 1.2 31 1.3 29 1.1 32 1.4 35 1.3 33 1.5 27 0.8 27 1.0 32 1.0 35 1.8 26 0.7 36 1.4 30 1.2 34 1.2

Lic. RAUL RUIZ ARIAS

23

CURSO DE SPSS

IV . Prueba Chi cuadrado


Paso 1. Ho : La variable en estudio se ajusta a determinada distribucin terica (Uniforme, exponencial, normal, poisson). Ha : La variable en estudio tiene un comportamiento aleatorio que no se ajusta a determinada distribucin terica. Paso 2. Establecimiento del nivel de significacin o error tipo I. Paso 3. Clculos previos y estimacin de la frecuencia esperada o terica Paso 4. Criterios de decisin: Se acepta la Ho, si X2 calc < X2 tab Se rechaza la Ho si X2 calc > X2 tab Prueba Chi - cuadrado Componentes de la frmula o estadstico de prueba: Oi = Frecuencia observada o emprica ei = Frecuencia terica o esperada k = Nmero de clases o categoras que se analizan m = Nmero de parmetros estimados en base a los datos primarios y que se usan en la determinacin de ei, siendo ei, la frecuencia terica para cada clase, se calcula a partir de la distribucin estudiada. Nota .- Como regla prctica se recomienda que la frecuencia terica esperada en cualquier intervalo no sea menor que 5. Ello se logra generalmente combinando intervalos sucesivos. Ejemplo 3. El Departamento de Psicologa, basndose en informaciones anteriores, al final del semestre antepasado, el 80% de los alumnos aprobaron todas las materias inscritas, un 10% aprob la mitad, un 6% reprob todas las materias y un 4% se retiro. Al final del semestre pasado el departamento selecciono a 400 alumnos, resultado 287 aprobaron todas las asignaturas, 49 aprobaron la mitad, 30 reprobaron todas las asignaturas y 34 se retiraron. Podemos concluir, a raz de los resultados, que la informacin del semestre antepasado se ha vuelto a repetir el semestre pasado? Hiptesis nula: de que los porcentajes del semestre pasado son los mismos que en el semestre antepasado. Atributos Aprob todo Aprob la mitad Reprob todo Se retir Total 2 = 27,178 Datos observados 287 49 30 34 400 Probabilidad 0,80 0,10 0,06 0,04 1 Datos esperados 320 40 24 16 400

Lic. RAUL RUIZ ARIAS

24

CURSO DE SPSS
Como tenemos 4 categoras y ningn parmetro estimado los grados de libertad sern: 4-1= 3

02,05;3 = 12,84
Como 27,178 es mayor que 12,84 se rechaza la hiptesis nula. Conclusin: Los porcentajes no se repitieron el semestre pasado

Usando el SPSS 1.- Definir las variables de estudio Se tiene la siguiente informacin: Atributos Aprob todo Aprob la mitad Reprob todo Se retir Total Datos observados 287 49 30 34 400 Probabilida d 0,80 0,10 0,06 0,04 1 Datos esperados 320 40 24 16 400

En la ventana vista de variables, identificar las variables con las que trabajaremos

Ponderando la base de datos

Lic. RAUL RUIZ ARIAS

25

CURSO DE SPSS

Encontramos la siguiente ventana:

Marcar frecuencias (variable a ponderar), marcar Ponderar casos mediante, encontramos:

y clic en Aceptar Realizar la prueba Chi-Cuadrado (prueba de bondad de ajuste)

Lic. RAUL RUIZ ARIAS

26

CURSO DE SPSS

y clic en Aceptar
atributo Aprob todo Aprob la mitad Reprob todo se retiro Total N observado 287 49 30 34 400 N esperado 320,0 40,0 24,0 16,0 Residual -33,0 9,0 6,0 18,0

Estadsticos de contraste
a Chi-cuadrado gl Sig. asintt.

atributo 27,178 3 ,000

a. 0 casillas (,0%) tienen frecuencias esperadas menores que 5. La frecuencia de casilla esperada mnima es 16,0.

El valor de Sig=0.000 < 0.05 , la muestra tiene datos que no corresponden a la poblacin. Problema 4.-

Lic. RAUL RUIZ ARIAS

27

CURSO DE SPSS

Problema 5.-

Lic. RAUL RUIZ ARIAS

28

También podría gustarte