Documentos de Académico
Documentos de Profesional
Documentos de Cultura
OBJETIVOS Al finalizar la prctica el estudiante ser capaz de: 1. Reconocer la estructura de las ventanas del programa SPSS. 2. Importar archivos a SPSS. 3. Preparar una base de datos para ser analizada en SPSS.
INTRODUCCIN
El programa SPSS (Statistical Product and Service Solution) es un conjunto de potentes herramientas de tratamiento de datos y anlisis estadstico, continuamente se va renovando estas herramientas operativas del sistema haciendolo cada vez ms fcil para el usuario, actualmente est en la versin 19. El programa permite abrir datos digitados en otros software tales como EXCEL, Dbase, entro otros. En el quehacer del profesional nutricionista, tanto en el campo clnico como en el de salud pblica, el conocimiento de este software va ayudar a gestionar sus datos, hacer un anlisis estadstico adecuado y elaborar un buen informe del anlisis de los indicadores de salud y nutricin. La enseanza del uso del SPSS en nutricin, se ha dividido en tres grandes temas: 1) gestin de datos, daremos un vistazo de cmo se emplea dicho programa para la preparacin de una base de datos para realizar el anlisis descriptivo, 2) estadstica descriptiva, realizaremos la obtencin de frecuencias, tablas cruzadas, histogramas y grficos para variables cualitativas y 3) pruebas inferenciales , las principares pruebas que todo nutricionista debe saber, tales como prueba t, anlisis de varianza, coeficiente de correlacin y anlisis de regresin simple.
i. Barra del Ttulo, con el men de control, el nombre de la ventana y los botones de minimizar, maximizar y cerrar. ii. Barra de Mens con Archivo, Edicin, Ver, Datos, Transformar, Analizar, Grficos, Utilidades, Ventana y ?. iii. Barra de Herramientas, donde estn los conos de las operaciones ms usadas. iv. Ventana Vista de Datos con la Lnea de Edicin de datos encima de ella y la Barra de estado a lo largo de la parte inferior. A diferencia de Excel esta ventana es UNICA, no podemos aumentar ms hojas. A partir de la versin 15 del SPSS se puede tener ms de un archivo de datos de SPSS abierto al mismo tiempo, no as en las versiones anteriores. v. Ventana Vista de variables, encontramos una hoja que contiene la informacin sobre las variables. El archivo con los datos tiene la extensin sav.
Barra del Ttulo
Barra de Herramientas
Barra de Mens
Figura .1a: Entorno SPSS (versin 12) b) Ventana de Resultados, llamado tambin Visor de Resultados, fig 1b, como su nombre lo indica recibe ah todos los resultados que se van generando. Se trata de un archivo nuevo, diferente al archivo que contiene la base de datos y tiene la extensin spo. Podemos archivarlo o cerrarlo sin grabar al terminar nuestro trabajo. Un archivo de resultados puede tener rpidamente 200 300 kb, sobre todo si tiene grficos.
c)
130
Datos, permite definir variables, asi como ejecutar modificaciones en las bases de datos: seleccionar parte de los registros, aadir, ponderar, etc. Transformar, aqu se encuentran todas las opciones relativas a la modificacin y generacin de nuevas variables. Las funciones de este men son temporales, y slo estn vigentes durante la sesin sin que afecten al archivo original. Si se quieren convertir en permanentes deben grabarse los cambios con GUARDAR. Analizar mediante este men se acceden a los diferentes anlisis estadsticos. Utilidades posibilitan mostrar informacin sobre los archivos SPSS, las variables, etc.
2. Gestin de datos
El primer paso para desarrollar el anlisis de los datos es preparar el archivo, creando nuevas variables a partir de lo que tenemos, calculando nuevas variables, colocando las etiquetas y valores a las variables que se considera necesarias, y as dejar listo la base de datos para el anlisis descriptivo y/o inferencial.
Caso 1: En el mes de abril del 2010 se realiz una encuesta a los estudiantes del tercer ao de la Escuela Acadmica Profesional de Nutricin de la Universidad Nacional Mayor de San Marcos, con el objetivo de tener un perfil del estudiante, los datos fueron digitados en el programa EXCEL y haciendo del uso del software SPSS queremos calcular el IMC y categorizar los diagnsticos nutricionales segn el ndice de Masa Corporal (IMC).
131
Asi mismo tenga en cuenta que cuando elabore listados de personas lo primero que tiene que asegurarse es dar a cada persona un cdigo que sea NICO. Procedimiento para ordenar los datos: a) En el archivo que tiene abierto, haga clic en <Vista de Variables>, en esa hoja observar las siguientes columnas: nombre, tipo, anchura, decimades, etiqueta, valores, perdidos, columna, alineacin, medida. b) En <Nombre> puede observar los nombres de las distintas variables. c) En <Tipo> puede ser de tres tipos: numrico, cadena y fecha. Observe que al importar los datos de EXCEL automaticamente siguen conservndo el formato que tenan. Asi por ejemplo: el peso y talla son <nmerico>; en cambio departamento, provincia, distrito tienen el tipo <cadena> texto. d) En <Anchura> y <Columna>: para poder ver el mayor nmero de variables por pantalla en Vista de datos deber reducir la Anchura y las Columnas segn se indica en la fig. 4.
132
Observe que estado civil tiene Anchura 1, pero en cambio la columna es 5. Eso quiere decir que para efectos de la informacion que contiene dicha columna, basta con un digito. En cambio para poder ver la varible necesitamos de 5 digitos o espacios.
e) En <Decimales>, aquellos datos que tengan decimal deber conservarlos: por ejemplo: Peso y Permetro de Cintura (un decimal), Talla (dos decimales) e IMC (un decimal). f) En <Etiqueta>, algunas variables necesitan de etiqueta, procederemos a digitar de acuerdo a las indicaciones las etiquetas a las variables que sean necesarias, ya que algunas son autoexplicativas y no las necesitan. Variable
Peso Talla Peri_Cin E_civil Q_horas Colegio Razon_EN Conocias Hemoglo Hb Dx_Hb Q_tipo Curs_Inf Q_cur Prom
Etiqueta
en kg. en mt. en cm Estado Civil Cuntas horas trabajas por semana? Colegio de Procedencia razn para elegir la carrera de Nutricin Conocas algn nutricionista? Te han hecho anlisis de hemoglobina? Resultado de hemoglobina Diagnstico de Hemoglobina Qu tipo de programa usa usted? Ha llevado algn curso de informtica? 1= Si; 2= No Qu curso de informtica? Promedio ponderado del semestre
g) Etiquetas de valores: en SPSS podemos colocar etiquetas a los valores de las variables cualitativas en EXCEL haciamos con comentario. Colocaremos etiquetas de valores para las variables estado civil, trabaja, conocias y hemoglo, de acuerdo a las siguientes indicaciones. Variables Estado civil : se ubica en la fila <estado civil> y en la columna <Valores> hacer doble clic sobre el botn plono que aparece en la celda que dice <Ninguno> correspondiente a e_civil y cuando aparece la pantalla de la figura 5 coloque en el casillero <Valor> el nmero <1> y luego en etiqueta de valor, la palabra <Soltero>; hacer clic en el botn <Aadir>. Repita el procedimiento con el valor 2 y la palabra Casado. No es necesario colocar las comillas, el programa lo har. Cuando termine hacer clic en <Aceptar>.
Para la variable Trabaja ponga como etiquetas: Si, para el cdigo 1 y No para el cdigo 2. Ahora puede copiar esa misma etiqueta para las variables conocias y hemoglo usando las teclas Ctrl C y Ctrl V. Tambien puede usar el menu contextual del ratn. Variable sexo: 1= masculino, 2=femenino.
133
h) En <Perdidos>: Si alguna vez necesita sealar valores Perdidos utilice esta funcin, para la variable Peri_Cin (Perimetro de cintura) haga clic en <Perdidos>, y aparecer la ventana de la figura 6; hacer clic en <Valores perdidos discretos> y escriba <999>.
i)
En <Medida>, haga clic sobre la celda correspondiente y ver el menu desplegable de la fig. 7. escala se refiere a una variable numrica de intervalo/razn; las otras dos son la escala ordinal y nominal. Aqu es donde le indicamos al programa el tipo de variable. Toda vez que reconocemos que la variable Cdigo aunque lleve nmeros es una variable cualitativa (nominal) hacemos clic en Nominal. Eso le indicar al programa que no puede ni sumar, ni sacar promedios, etc. con dicha variable. Para Edad el programa le ha puesto escala porque por defecto toda variable nmerica presupone que es escala. A la variable Sexo porque est escrita como Cadena (texto) le ha colocado por defecto Nominal . Note que lo mismo ha sucedido con las dems variables de texto (fig. 8).
Nota.- Estas especificaciones pueden ser cambiadas en cualquier momento que sea necesario. Una vez puestas las etiquetas a las variables, se tiene la ventaja de poder visualizar dichas etiquetas en <Vista de Datos> presionando el icono correspondiente (el penltimo de la Barra de Herramientas), o tambin en <Ver>, <Etiquetas de Valor>.
Paso 3: Uso de cuadros de dilogo de SPSS Estadistica descriptiva - frecuencias Ahora que ya tenemos datos ordenados conoceremos los cuadros de dilogo de SPSS. Los cuadros de dilogo de SPSS se utilizan para seleccionar variables y opciones para el anlisis y tienen una estructura similar. Vamos a usar el Cuadro de Dilogo de frecuencias para ilustrar nuestro caso. Procedimiento: En la barra de Mens hacer clic sobre <Analizar>, <Estadsticas Descriptivas> y <Frecuencias>. Fig 9.
134
Y aparece el cuadro de dilogo de la figura 10 el cuadro tiene cuatro partes diferenciadas: dos casilleros para las listas de variables y dos reas de botones. Vemos en la figura 10, en la lista de variables del lado izquierdo junto al nombre de cada variable un icono de color amarillo, en algunos casos aparece una letra A (variables cualitativas), en otros un smbolo de nmero (variables cuantitativas) para diferenciar a las variables segn tipo. Para usar cualquier procedimiento estadistico tendr primero que seleccionar las variables que necesita del lado izquierdo y pasarlas al lado derecho, una por una o todas las necesarias, presionando el botn punta de flecha que se encuentra entre ambos recuadros. El botn <Aceptar> es el que sirve para ejecutar un comando, est visible slo despus que toda la informacin requerida por el programa ha sido completada. Con el botn Pegar, las rdenes se van guardando, conforme se van ejecutando, en un archivo diferente (*.sps). Los botones de funciones son especificos y dan las instrucciones para que realice una accin o abrir un sub.cuadro de dilogo para realizar especificaciones adicionales.
Variable Seleccionada
Botones Comunes
Nota.- Slo aparecern las variables sobre las cuales se puede ejecutar la funcin requerida. Hacer una frecuencia de nmero y porcentaje de estudiantes segn distrito de procedencia.
135
h) En <Vista de Datos> mueva la barra inferior de deslizamiento hacia la derecha y observar en la ltima columna a la variable recin creada <imc>. Fig.13.
136
Paso 5: Diagnsticos nutricionales a partir del IMC (Funcin: Recodificar Valores) Para la recodificacin de valores usaremos la variable recin creada <IMC>. La cual ser dividia en CUATRO categorias: delgado para los valores menores de 18.5 kg/m2, normal para aquellos que tienen el IMC entre 18.5 y 24.9 kg/m2 sobrepeso para los valores mayores a 25 kg/m2; obesidad para los mayores de 30 kg/m2 .
Procedimiento para categorizar los diagnsticos nutricionales a) En la Barra de Mens haga clic en <Transformar>, elija <Recodificar en distintas variables> fig. 14.
b) En el casillero <Nombre> escriba el nombre la Nueva Variable <catimc>, y en <Etiqueta> escribir <categoriaimc>, tal y como aparece en la figura 15. Hacer clic en Cambiar
c) Haga clic en el botn <Valores Antiguos y Nuevos> y aparecer la pantalla de la figura 16. d) Deber hacer clic en el casillero <Rango>
Unidad IV: Tema 11
En el lado derecho hacer junto a <Rango> Del menor hasta y escribir 18.49. En el lado derecho escoger <Valor> y en el casillero en blanco escribir 1. Finalmente hacer clic en el botn <Aadir>.
e) Para la segunda categoria, deber escoger el primer <Rango> y digitar en un casillero 18.5 y en el otro 24.9 , del lado derecho deber escribir 2 en el casillero vacio junto a <Valor>.
137 SPSS Gestin Datos
f) Repita el procediminto para la categoria 3 (de 25 a 29.9). g) Para la categoria 4, escoger la tercer opcin de <Rango> hasta el mayor y colocar 30 en el casillero en blanco que est debajo de l.
h) Posteriormente regresar a la pantalla que se muestra en la fig. 17 dar clic a cambiar y luego <aceptar>.
Colquese en la hoja <Vista de Variables> y cambie las siguientes caractersticas de las variables: Anchura=4; Decimales=0 Valores/etiquetas: 1= Adelgazado; 2= Normal; 3= Sobrepeso; 4= Obesidad.
Trabajo Grupal N 1 (1 punto) Objetivo: Ordenar los datos colocando etiquetas y hacer una frecuencia. En el archivo 6dep.sav, se tiene informacin de salud y nutricin de nios menores de 36 meses de seis departamentos. Coloque las etiquetas y los valores a dos variables grupo de edad y deficiencia de vitamina A, de acuerdo a las indicaciones del cuadro:
Nombre de la variable GEDAD DEFA Unidad IV: Tema 11 Etiqueta Grupo de Edad Deficiencia de Vitamina A 138 Valores Al valor 12 etiqueta 12 a 23.9 m. Al valor 24 etiqueta 24 a 35.9 m. Al valor 1 etiqueta Deficiente Al valor 2 etiqueta No Deficiente SPSS Gestin Datos
Nota: observe que las variables nominales: AREA, SEXO, ANE, GANENIN tienen etiqueta en variable y en valores.
Luego hacer una frecuencia de grupo de edad por sexo. Comentar sus resultados: _______________________________________________________________________________ _______________________________________________________________________________
Trabajo Grupal N 2 (1 punto) Objetivo: Calcular nuevas variables Con el mismo archivo 6dep.sav, determine la frecuencia de los nios enfermos (total), con diarrea, con tos y sanos, a partir de la creacin de una nueva variable denominada ENFER2, con la opcin <Transformar>, <Calcular variable> y luego frecuencias en <Analizar>. Calcule la variable ENFER2, a partir de las variables diarrea y tos. ENFER2 tendr el cdigo <1> si es que el nio no tiene ninguna enfermedad (diarrea=2, tos=2), el cdigo <2>, si tiene tos (diarrea=2, tos=1) y el cdigo <3> si slo tiene diarrea (diarrea=1, tos=2), y el cdigo <4> si tiene ambas enfermedades (diarrea=1, tos=1),. Una vez que termina haga una frecuencia de la variable ENFER2. Para la variable enfer2 colocar como etiquetas: 1= Sano, 2=Slo diarrea, 3= slo tos, 4=Enfermo.
Comentar sus resultados: _______________________________________________________________________________ _______________________________________________________________________________
ANEXO Ejercicio adicional Objetivo: Calcular porcentaje de adecuacin de energa y hierro. Se ha recogido informacin sobre el consumo de energa y nutrientes de 42 nios en el AAHH Casas Huerta Surquillo. Se le pide calcular la mediana del porcentaje de adecuacin de la energa y hierro. Los datos estn en el archivo Excel casas_huerta.xls. Como recordar, antes de poder conocer el
porcentaje de adecuacin necesitamos tener la informacin sobre el requerimiento/recomendacin. Recuerde que los factores para la energa fueron: 102 kcal/kg PC para los nios del grupo etreo 12 y 90 kcal/kg PC para el grupo etreo de 48. Respecto al hierro las recomendaciones fueron de 7 mg/d para los nios del grupo etreo 12 y 10 mg/d para el grupo etreo de 48.
COD EDAD SEXO PESO TALLA 1 2 3 4 5 6 7 8 9 10 15 15 15 15 16 15 14 16 15 15 1 1 2 1 2 2 2 2 1 1 48 56 50 79 59 56 61 52 80 73 1.69 1.57 1.57 1.7 1.57 1.63 1.62 1.61 1.73 1.67
2.- La variable Edad ser numerica, sin decimales. 3.- la variable Sexo tendr dos categorias 1 y 2, para Masculino y Femenino respectivamente. 4.- El peso ser numerica sin decimales 5.- La talla numrica con dos decimales. Calcule el IMC y categorize la variable.
2. Exportar un archivo
Los datos de un archivo *.sav pueden ser pueden exportados a otros programas (Excel o dbf). Para ello, en la barra de mens, haga clic sobre <Archivo>, luego haga clic en <Guardar como>. En el cuadro de dilogo, seleccione el tipo de archivo <Excel (*.xls)>, en la parte inferior del cuadro de dialgo, escoja el lugar donde lo va a guardar y pngale un nombre. 3. Ordenar Casos Para ordenar las columnas, haga clic en <Datos>, luego en <Ordenar Casos> y pase al lado derecho la variable sobre la cual desee realizar el ordenamiento. El primer criterio sera la variable sexo, el segundo criterio peso y finalmente talla. Si fuera necesario podramos seguir aadiendo mas variables (fig. 1).
4. Seleccin de una muestra aleatoria En SPSS con la orden <Seleccionar Casos> podemos seleccionar una muestra aleatoria a partir de una base de datos digitada. sta opcin es muy til cuando queremos verificar la digitacin de un determinado porcentaje de nuestros registros. Seleccionamos la muestra y luego corroboramos los datos digitados con la encuesta en papel. Esta actividad tambin forma parte del control de calidad de los datos. Ejercicio: Utilice la base de datos 6dep.savpresione <Datos>, <Seleccionar Casos>, <Muestra Aleatoria de Casos>. Cuando aparezca el cuadro de dilogo escriba 15%. Presione el botn <Continuar> y finalmente <Aceptar>. Note en el lado izquierdo de la pantalla que algunos nmeros aparecen tachados y otros no. Lo que ha hecho el programa es filtrar, y aquellos registros que estn sin tachar son los que servirn para hacer los clculos futuros. Para deshacer la seleccin. Presione <Datos>, <Seleccionar casos>, y haga clic en la primer lnea <Todos los casos>. *****
140