Está en la página 1de 16

León Dario Bello Parias

Estadístico

Docente Facultad Nacional de Salud Pública

Universidad de Antioquia

ldbello@guajiros.udea.edu.co

XI Jornadas de Epidemiología en Neiva – Huila –

Colombia Marzo de 2004


Generalidades sobre el SPSS
León Darío Bello P.

SPSS Versión 11.0


(Statistical Package for the Social Sciences)

El SPSS es una marca registrada que tiene como software bandera el


programa estadístico que lleva su nombre, es de uso general e integra
procedimientos estadísticos y gráficos interactivos de alta resolución, de tal
manera que sirve de apoyo al análisis de datos, así como a la preparación de
los datos (transformaciones) . Su modulo gráfico en ésta versión es lo menos
potente, de ahí que en la nueva versión (12.0), se haya colocado el mayor
énfasis a mejorar dichos gráficos. Permite la construcción de tablas de
frecuencias univariadas y bivariadas, permitiendo agrupar los resultados por
segmentos o estratos. Calcula estadísticas descriptivas, presentando sus
resultados de tal manera que permite la comparabilidad. Tiene incorporados
los procedimientos más usuales y/o actuales de la estadística paramétrica
(intervalos de confianza y pruebas de hipótesis) y no paramétrica. Permite
comparar dos o más poblaciones según sea el caso. Además, de
procedimientos multivariados dependientes (regresión múltiple, análisis
discriminante, ANOVA) o de interdependencia (análisis de Factor, de
Conglomerados).

Pasos básicos.

Los pasos a seguir en el análisis de datos utilizando el S.P.S.S son los


siguientes:
Entrada de datos: Puede abrir un archivo de datos previamente guardado,

leer una hoja de cálculo, un archivo de texto o una base de datos, o

introducir los datos directamente en el Editor de datos.

 Explore los datos y realice las transformaciones necesarias para


lograr los objetivos propuestos.

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

 Seleccione un procedimiento en los menús para crear tablas, calcular


estadísticos o generar gráficos.
 Seleccione las variables que desea utilizar en el análisis. Es vital tener
presente la escala de medición de las variables.
 Ejecute el procedimiento y analice los resultados.

COMO INICIAR UNA SESION: La instalación coloca el icono del paquete en


el sub menú programas del botón Inicio. Luego de entrar al programa, se
maximiza la ventana, en la cual se editan (digitan) los datos. La presentación
en pantalla, luego de activar el menú de Archivo es:

En dicho menú se activan las opciones correspondientes fundamentalmente


al manejo de archivos, es decir, se llaman nuevos archivos, se crean, se
guardan y se imprimen. El SPSS tiene una característica en cuanto a los
archivos que crea, y es la de guardar los resultados en archivos distintos a
los de resultados, así como otras posibilidades, tal como se aprecia en la
pantalla mostrada previamente.

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Los archivos de datos son grabados con extensión *.sav, sin embargo, los
resultados se graban con extensión *.spo, permitiendo grabar diferentes
resultados en diversos archivos. Además, permite grabar formatos de tablas,
programas de sintaxis etc. Con diferentes extensiones.

Creación o Modificación de la estructura de un archivo de datos: El


siguiente pantallazo muestra las opciones a definir cuando se crea un archivo
con formato .sav, o para modificar una estructura ya hecha.

Para activar el pantallazo anterior, es necesario darle clic en la pestaña


ubicada en la parte inferior de la ventana de edición de datos, para luego
digitar los nombres de las variables con sus respectivas características, así:
Ejemplo

Nombre: Máximo 8 caracteres. clso


Tipo: Tipo de dato. Cadena
Anchura: Espacio disponible para entrar datos. 1
Decimales: Cantidad de decimales (datos numéricos) 0
Etiqueta: Describir la variable objeto de estudio, de tal manera que dicha
etiqueta salga en los cuadros de salida. Sexo del Paciente

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Valores: Cambia los datos de entrada por nuevos rótulos o códigos. Tal
como se aprecia en la pantalla – Etiquetas de Valor -
Perdidos: Se utiliza en caso de definir de antemano algunos códigos que
representaran valores no válidos para el análisis. 99
Columna: Permite observar un número determinado de columnas, por
defecto es de ocho. 8
Alineación: Poco usada, hace referencia a la presentación de la entrada de
valores. Derecha
Medida: Punto clave y fundamental para el posterior análisis de
resultados. Nominal
Luego de construir la estructura y de digitar o importar los datos, se procede
a realizar el control de calidad de los datos, situación independiente de la
parte propiamente estadística. Por lo tanto, se presentarán primero lo que he
llamado órdenes de manejo, para luego entrar con las órdenes de
procedimiento.
ORDENES DE MANEJO: Están concentradas básicamente en los menús de
Opción de Datos y en Transformar.

En Datos, se puede: Insertar variables y/o casos, ordenar variables


ascendente o descendentemente, unir archivos, tanto de manera horizontal
(variables) como vertical (casos), seleccionar de un número de registros,
algunos con características especiales o con fines de auditoria y muestreo.
Tiene además, la potente opción de segmentar archivos, con la cual se
optimiza de manera importante la forma de presentar información según
variables de identificación, como: Municipio, región, comuna, zona, tipo de
institución, sexo, escolaridad etc. Dado la importancia de ésta última opción,

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

se muestra a continuación.
La variable seleccionada es usualmente categórica y lo que se pretende es
que los resultados posteriores se entreguen según dicha variable, es decir,
para hombres y para mujeres de manera separada.

Transformar, es vital en el procesamiento de datos, ya que permite


transformar los datos realizando cálculos, cambiando escalas, aplicando
funciones. Incluso a las variables nominales se les puede recodificar. Las
posibilidades de Transformar se muestran en el siguiente pantallazo.

De las anteriores, las más utilizadas son: Calcular, opción que permite
transformar los datos en bruto y Recodificar, la cual permite cambiar no sólo
códigos, si no cambiar el nivel de la escala de medición de una cuantitativa a
una categórica. Las cajas de dialogo para dichas alternativas son:

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

En la caja de dialogo se plantea la necesidad de calcular la edad de los


pacientes en meses, por lo tanto se multiplica la variable original en años por
12, tal como lo muestra el pantallazo anterior.

En la de recodificación, se observa como se codifica la variable edad según


dos categorías, Adultos (48 a 50) y Adultos Mayores (más de 50). Esta caja
de dialogo es la utilizada cuando la recodificación es en otra variable.

ORDENES DE PROCEDIMIENTO: Se encuentran ubicadas en el menú,


ANALIZAR, cualquier orden que involucre un procedimiento estadístico, bien
sea paramétrico o no, multivariante o no, dependiente o no, clásico o no, se
encuentra ubicado en ésta opción del menú. Se mencionaran las dos
opciones más usuales, ellas son: La parte de estadística descriptiva y la de
comparación de medias. La primera entrada es la siguiente:

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Como se observa, esta opción permite realizar todos los procedimientos


estadísticos más usuales, bien sean univariados, bivariados y multivariados,
además, de paramétricos o no paramétricos, tanto para datos numéricos
como para datos categóricos.

En el Sub menú Estadísticos Descriptivos se realizan los procedimientos de:


Frecuencias, Medidas de Posición y de Variación, análisis exploratorio de
datos y cruces de variables. La entrada inicial es la siguiente:.
Las frecuencias simples (.Analizar + Estadísticos descriptivos +
Frecuencias), ayudan a determinar la existencia de errores de digitación y/o
de situaciones anormales o atípicas. La caja de dialogo y las opciones a
seleccionar son:

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Nótese la diferencia en los


iconos que anteceden los
nombres de las variables.

Se seleccionan las
medidas requeridas, de
acuerdo a las necesidades
de información.

Los resultados entregados sin ningún formato adicional son:


Estadísticos

Talla en Categorías
SEXO Clase Social metros Edad
N Válidos 70 70 70 70
Perdidos 0 0 0 0
Media 1.50 1.91
Mediana 1.50 2.00
Es claro que estas medidas
Moda 1a 2 no son adecuadas para las
Desv . tí p. .504 .531 variables sexo y clase social.
Percentiles 5 1.00 1.00
a. Existen v arias modas. Se mostrará el menor de los v alores.

Clase Soci al

Porcentaje Porcentaje
Frecuencia Porcentaje v álido acumulado
Válidos 1 13 18.6 18.6 18.6
2 50 71.4 71.4 90.0
3 7 10.0 10.0 100.0
Total 70 100.0 100.0

Se requiere de pulir las tablas, ya que en algunos casos no se requieren las


frecuencias acumuladas y en otros el porcentaje valido es igual a la columna
titulada porcentaje.

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Otra posibilidad que brinda el SPSS y que es fundamental en el análisis


previo de los datos, es el análisis exploratorio de datos (Analizar +
Estadísticos descriptivos + Explorar), cuya caja de dialogo es:

Lo que se pretende es identificar la existencia de valores atípicos y/o


extremos en las variables cuantitativas, según una(s) variables categóricas.
Entrega por defecto, las medidas descriptivas y los gráficos de tallo y hojas y
de caja y sesgo. Tal como se observa a continuación:

Descriptiv os

SE XO Es tadístico Error típ.


Tens ión arterial s istólic a Hombre Media 144.86 3.600
Intervalo de c onfianza Límite inferior 137.54
para la media al 95% Límite superior
152.17

Media rec ortada al 5% 144.68


Mediana 140.00
Varianza 453.655
Desv. típ. 21.299
Mínimo 110
Máximo 185
Rango 75
Amplitud intercuartil 40.00
As imetría .152 .398
Curtosis -1.326 .778
Mujer Media 135.37 2.801
Intervalo de c onfianza Límite inferior 129.68
para la media al 95% Límite superior
141.06

Media rec ortada al 5% 134.02


Mediana 130.00
Varianza 274.534
Desv. típ. 16.569
Mínimo 115
Máximo 180
Rango 65
Amplitud intercuartil 18.00
As imetría 1.219 .398
Curtosis 1.393 .778

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Tensión arterial sistólica Stem-and-Leaf Plot for


SEXO= 1

Frequency Stem & Leaf

2.00 11 . 05
7.00 12 . 0000055
6.00 13 . 000005
4.00 14 . 0005
3.00 15 . 000
5.00 16 . 00055
7.00 17 . 0000055
1.00 18 . 5

Stem width: 10
Each leaf: 1 case(s)

Tensión arterial sistólica Stem-and-Leaf Plot for


SEXO= 2

Frequency Stem & Leaf

3.00 11 . 555
10.00 12 . 0000055555
9.00 13 . 000005555
7.00 14 . 0000355
2.00 15 . 00
2.00 16 . 05
2.00 Extremes (>=180)

Stem width: 10
Each leaf: 1 case(s)

200

180 14
22

160
Tensión arterial sistólica

140

120

100
N= 35 35

1 2

SEXO

Los resultados se entregan teniendo en cuanta las categorías de la variable


cualitativa o factor. Es labor del investigador definir en que casos se deben
eliminar casos o estimarlos.

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

El gráfico de caja y sesgo, así como el de tallo y hojas, muestra de manera


más diciente los valores considerados como anormales. De ahí la
importancia de realizar éste procedimiento antes de construir las tablas y
gráficos y calcular indicadores.

Tablas de Contingencia. (Analizar + Estadísticos descriptivos + Tablas de


contingencia)

El cruce de variables pretende identificar si existe relación entre dos o más


de ellas, además, de posibilitar el análisis de estas variables en una sola
tabla, en lugar de construir dos cuadros simples. Estas tablas aplican
fundamentalmente para variables categóricas o incluso cuantitativa discreta
si ésta no tiene muchas categorías de respuestas

Es útil recalcular manualmente los porcentajes marginales donde da 100%,


con el fin de determinar los porcentajes de las categorías pertenecientes a la
variable independiente. Lo usual es redactar los datos encontrados en las
márgenes del cuadro, para luego identificar posibles relaciones entre las
variables redactando las celdas interiores de la tabla. La tabla como la
entrega el programa se muestra a continuación.

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Tabla de contingencia Clase Social * SEXO

SEXO
Hombre Mujer Total
Clase Alta Recuento 8 5 13
Social % de SEXO 22.9% 14.3% 18.6%
Media Recuento 24 26 50
% de SEXO 68.6% 74.3% 71.4%
Baja Recuento 3 4 7
% de SEXO 8.6% 11.4% 10.0%
Total Recuento 35 35 70
% de SEXO 100.0% 100.0% 100.0%

Compara Medias (Analizar + Estadísticos descriptivos + Compara medias).


El Sub menú Comparar Medias permite realizar procedimientos de Inferencia
Estadística, tales como diferencia de medias para datos paramétricos, tanto
para muestras relacionadas como no relacionadas, además, del
procedimiento ANOVA de una vía. Las opciones son las siguientes:

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Los resultados siguientes, muestran los resultados originados por la


comparación de medias para las variables cuantitativas, Trigliceridemia y
Colesterolemia Basal, según la variable cualitativa clase social. Es claro, que
el programa permite realizar las operaciones y cálculos que el usuario le
defina, la situación importante, es que se le den órdenes que relacionen
variables con significado según la teoría estudiada.
Trigliceridemia basal Colesterolemia basal * Clase Social
Trigliceridemi a basal Colesterol emia basal * SEXO
Trigliceridemia Colest erolemi
Trigliceridemia Colest erolemia Clase Social basal a basal
SEXO basal basal Alta Media 141.77 238.38
Hombre Media 139.88 246.66 N 13 13
N 34 35 Desv . t íp. 44.805 35.643
Desv . tí p. 39.193 39.478 Media Media 136.45 239.50
Mujer Media 138.03 226.89 N 47 50
N 33 35 Desv . t íp. 34.803 35.152
Desv . tí p. 37.030 25.893 Baja Media 150.71 214.29
Total Media 138.97 236.77 N 7 7
N 67 70 Desv . t íp. 47.352 21.937
Desv . tí p. 37.865 34.605 Total Media 138.97 236.77
N 67 70
Desv . t íp. 37.865 34.605

OPCION GRAFICA.
Hace referencia a los diferentes gráficos, tales como la nube de puntos,
utilizada fundamentalmente en regresión, gráficos de análisis exploratorio de
datos y los conocidos para los negocios, como: Barras, pastel, lineas etc. No
sobra, resaltar que todos los procedimientos tienen diferentes opciones de
maquillaje. No obstante, los gráficos no son el punto fuerte de éste paquete,
al menos hasta la versión 11.5, ya que la nueva versión del 2004, realiza
cambios importantes en éste sentido, de ahí, que el énfasis de éste
documento no es presentar opciones que ya están rediseñadas, no obstante,
se muestran algunas generalidades de la versión 11.0.

Es importante anotar que cada uno de ellos permite diferentes opciones, por
ejemplo el histograma se puede construir con diseños como los presentados
posteriormente.

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

Algunos de los más utilizados son:

Barras: Simple, Agrupada y Apilada


Dispersión: Simple y Superpuesto.
Líneas: Simple y múltiples.
Sectores: Circular o pastel
Area: Simples y apiladas.
Autocorrelaciones: Series de Tiempo
Control: Control de Calidad
Diagramas de caja: Medidas de posición.
Barras de Error: Intervalos de Confianza al 95%

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -
Generalidades sobre el SPSS
León Darío Bello P.

El que aprende y aprende y


no práctica lo que sabe, es
como el que ara y ara y
nunca siembra.
Platón
Digite la siguiente información:

EDAD SEXO ESTADO CIV. PROFESIÓN SALARIO (miles ESTRATO


semanal)
28 Hombre Soltero Estadístic@ 400 4
38 Mujer U .libre Enfermer@ 500 3
51 Mujer Soltero Médic@ 450 4
44 Mujer Soltero Enfermer@ 450 5
27 Hombre Soltero Médic@ 480 4
40 Mujer U .libre Bacteriólog@ 1250 5
38 Mujer Soltero Médic@ 400 3
40 Mujer Casado Otra 450 6
38 Hombre Casado Enfermer@ 450 3
51 Hombre U. libre Otra 250 4
30 Mujer Soltero Médic@ 5
32 Mujer Soltero Enfermer@ 450 4
28 Hombre Soltero Bacteriólog@ 400 3
45 Hombre Soltero Otra 380 3
55 Mujer U. libre Enfermer@ 420 5
38 Hombre Casado Médic@ 515 5
28 Mujer Soltero Bacteriólog@ 545 6
53 Mujer Casado Enfermer@ 485 4
30 Hombre Soltero Bacteriólog@ 379 4
30 Mujer Casado Bacteriólog@ 450 5
1. Realice el análisis exploratorio de datos (variables cualitativas y
cuantitativas).
2. Realice los cambios que considere necesarios (justifique sí es del caso)
3. Calcule el salario con unidad de medida en mes y la edad en meses.
4. Recodifique la edad en tres categorías: Menos de 30, de 31 a 40 y más de
50. De los nombres que considere adecuados.
5. Cruce las variables sexo VS estado civil y sexo VS estrato. Diga si las
variables están relacionadas. Justifique.
6. Calcule las medidas descriptivas para las variables cuantitativa y diga cual
es más homogénea.
7. Utilizando el diagrama de caja y sesgo, diga si la profesión influye en el
salario.
8. Con las medidas de posición diga que forma parecen tener los datos.
9. Construya el histograma para las variables cuantitativas. Interprételo.
10. Calcule los percentiles 20, 40, 60 y 80. Interprételos.
11. Calcule los cuartiles e interprételos.
12. Diga si es mayor el salario de mujeres que el de los hombres puede
generalizar el resultado?

ldbello@guajiros.udea.edu.co 28/10/a
Docente FNSP – U de A -

También podría gustarte