Está en la página 1de 8

Universitat de Barcelona

Institut de Cincies de l'Educaci


Secci de Recerca
Butllet LaRecerca
ISSN: 1886-1946 / Dipsit legal: B.20973-2006
Ficha 6. Junio, 2006
1
Fichas para investigadores
________________________________________________________________
Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo
con el paquete estadstico SPSS?
________________________________________________________________
Autora:
Vil Baos, Ruth. Departament de Mtodes d'investigaci i Diagnstic en Educaci.
Universitat de Barcelona.
El anlisis cuantitativo de datos mediante la informtica estadstica
En la actualidad es difcil hablar de procesos estadsticos de anlisis cuantitativo de datos
sin hacer referencia a la informtica aplicada a la investigacin. Estos recursos
informticos se basan a menudo en paquetes de programas informticos que tienen por
objetivo ayudar al/la investigador/a en la fase de anlisis de datos. En estos momentos
uno de los paquetes ms perfeccionados y completos es el SPSS (Statistical Package for
the Social Sciences).
El SPSS es un paquete de programas para llevar a cabo el anlisis estadstico de los
datos. Constituye una aplicacin estadstica muy potente, de la que se han ido
desarrollando diversas versiones desde sus inicios, en los aos setenta. En esta ficha las
salidas de ordenador que se presentan corresponden a la versin 11.0.1. No obstante,
aunque la forma ha ido variando desde sus inicios, su funcionamiento sigue siendo muy
similar entre las diferentes versiones.
Antes de iniciarnos en la utilizacin de las aplicaciones del SPSS es importante
familiarizarse con algunas de las ventanas que ms usaremos. Al entrar al SPSS lo
primero que nos encontramos es el editor de datos. Esta ventana visualiza, bsicamente,
los datos que iremos introduciendo. El editor de datos incluye dos opciones: la vista de
los datos y la de las variables. Estas opciones pueden seleccionarse a partir de las dos
pestaas que se presentan en la parte inferior. La vista de datos contiene el men
general y la matriz de datos. Esta matriz est estructurada ubicando los casos en las filas
y las variables en las columnas.
La matriz de datos
En una investigacin, una vez finalizado el proceso de recogida de datos, toma
protagonismo la creacin de la matriz de datos (que se encuentra en el visor de edicin
de datos del SPSS). Una matriz de datos es una estructura en forma de tabla que
contiene los valores de cada sujeto en las diferentes variables. Habitualmente se colocan
las variables en las columnas y los individuos en las filas, aunque no tienen por qu
coincidir el nmero de variables con el de columnas, o el nmero de filas con el nmero
de individuos.
Crear la matriz de datos implica definir las variables que se consideran para el estudio e
introducir los datos recogidos. La vista de variables nos permite hacer especificaciones
Universitat de Barcelona
Institut de Cincies de l'Educaci
Secci de Recerca
Butllet LaRecerca
ISSN: 1886-1946 / Dipsit legal: B.20973-2006
Ficha 6. Junio 2006
Vil, Ruth
Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS?
2
sobre las variables que contiene nuestra matriz de datos. En esta ventana las diferentes
variables se encuentran situadas en las filas, mientras que las caractersticas a definir de
las mismas se encuentran en las columnas. Concretamente, podemos definir los
siguientes aspectos de cada una de las variables del estudio:
- El nombre de la variable lo utilizaremos para visualizarlo en la matriz y, por
tanto, nos interesa un nombre corto (mximo de 8 dgitos) que nos identifique
cada una de las variables.
- El tipo de variable nos permite distinguir si la variable es numrica o
alfanumrica.
- En la amplitud de la variable podemos definir el nmero de dgitos que
contempla esta variable en la matriz de datos.
- Los decimales suponen definir el nmero de decimales que contiene la variable.
- En la etiqueta de la variable podemos proporcionar un nombre ms largo y
especfico que identifique el contenido de la variable que generemos. Esta
etiqueta es la que aparecer en las salidas de resultados. En caso de no definirla
se utiliza por defecto el nombre de la variable.
- Los valores de la variable se utilizan por aquellas variables cualitativas que
disponen de categoras. Por ejemplo, el sexo tiene las categoras "femenino" y
"masculino". En este caso, hacemos clic en la opcin de valores y en el cuadro de
dilogo que surja podemos especificar los valores numricos y su correspondiente
etiqueta de valor. Despus de cada una de las especificaciones es necesario darle
a agregar.
- Los valores perdidos son aquellos valores que no se tienen en cuenta para el
anlisis de los resultados. El SPSS identifica dos tipos: los perdidos por el sistema
(cualquier casilla en blanco dentro de la matriz de datos) y los perdidos por el
usuario. En este ltimo caso es el usuario el que define cules son estos valores.
En el cuadro de dilogo que aparece podemos escoger entre diferentes opciones:
podemos definir valores perdidos que no sean consecutivos (valores perdidos
discretos), o bien podemos definir un rango de valores perdidos ms un valor
discreto opcional. Por ejemplo si en el sexo tenemos que 1 es femenino y 2 es
masculino, podemos definir un rango de 3 a 999999 y un valor discreto 0, como
valores perduts.
- La opcin columna nos permite definir o modificar la amplitud que ocupa la
columna para cada variable dentro de la vista de datos y no afecta en ningn caso
la amplitud definida previamente.
- La alineacin hace referencia a cmo se sitan los datos en la columna
correspondiente dentro de la vista de datos (a la derecha, izquierda o centradas).
- Por ltimo, debemos especificar el tipo de escala de medida que utilizaremos
para cada variable. Aparece un men en el que podemos escoger la escala
correspondiente: Escala, Ordinal o Nominal.
Una vez que hemos definido todas las caractersticas de las variables del estudio
podemos comenzar a introducir los datos dentro del editor de datos.
Una vez elaborada la matriz de datos, pero de forma previa al anlisi propiamente dicho,
es ms que recomendable hacer una primera revisin de los posibles errores que
contenga la matriz y que puedan alterar los resultados del estudio que se pretende
hacer. Para ello, disponemos de los procesos de depuracin de la matriz de datos. Estos
procedimientos consisten en corregir dos posibles fuentes de error: errores en la
correccin del instrumento de medida o bien errores en la transcripcin de los valores en
la matriz de datos.
Universitat de Barcelona
Institut de Cincies de l'Educaci
Secci de Recerca
Butllet LaRecerca
ISSN: 1886-1946 / Dipsit legal: B.20973-2006
Ficha 6. Junio 2006
Vil, Ruth
Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS?
3
Fig. 1 Pasos para pedir estadsticos descriptivos en el SPSS para la depuracin de la matriz
Depurar la matriz de datos consiste bsicamente en calcular algunos estadsticos
descriptivos de todas las variables (en el SPSS se pueden pedir desde la opcin del men
analizar/estadsticos descriptivos/frecuencias), como por ejemplo:
Las frecuencias absolutas de cada una de las categoras o valores que toma la
variable para verificar que no hay ningn valor ajeno a los valores lgicos de la
variable. Por ejemplo con la variable sexo, podemos tener las dos categoras
femenino y masculino. Si adems encontramos un valor numrico, podemos
deducir que se trata de un error.
El nmero de individuos de cada variable para verificar que sea correcto y que no
se ha olvidado ni duplicado ningn individuo.
El mnimo y el mximo (en la opcin de estadsticos del cuadro de dilogo) para
verificar que no existan valores extremos que sobrepasen o no lleguen al rango
lgico de la variable. Si tenemos la variable edad y la muestra es alumnado de
primaria, se trataria de verificar que no exista ningn valor inferior a 6 aos o
superior a 12, dado que seguramente sera un error.
La depuracin de la matriz es bsica, ya que si no detectamos y corregimos estos
posibles errores de transcripcin o correccin podran producirse graves errores en los
resultados finales.
Por otro lado, algunos de estos procesos de depuracin de la matriz se inician de forma
previa a la introduccin de datos, con la misma definicin de las variables cuando se
consideran los valores perdidos de cada una. Los valores perdidos del/la usuario/a se
especifican para cada variable por parte de la persona investigadora. Considerando el
rango posible de valores para las cuantitativas contnuas, se puede definir un intervalo de
valores que se encuentren fuera de los lmites posibles de cada variable. Aquellos valores
que manifestamos que son perdidos, no se consideran para el anlisi de datos, ya que
podran alterarlo.
1
3
2
Universitat de Barcelona
Institut de Cincies de l'Educaci
Secci de Recerca
Butllet LaRecerca
ISSN: 1886-1946 / Dipsit legal: B.20973-2006
Ficha 6. Junio 2006
Vil, Ruth
Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS?
4
El anlisis descriptivo
Despus de la depuracin de la matriz de datos es frecuente dar prioridad a un anlisis
exploratorio EDA (Exploratory Data Analysis) basado en el anlisis descriptivo de cada
variable, que permite una mayor comprensin del fenmeno. Por este motivo, tiene una
especial importancia la deteccin de outliers o sujetos con puntuaciones que se
distancien notablemente de los modelos establecidos para el resto de individuos de la
muestra.
La estadstica descriptiva univariable da cuerpo al anlisis exploratorio de los datos,
describiendo las caractersticas de un hecho, objecto o fenmeno. Este anlisis se puede
efectuar desde una perspectiva ms visual mediante tablas y representaciones grficas;
y desde una perspectiva ms analtica a travs de los indicadores estadsticos.
Tablas y representaciones grficas
El SPSS proporciona tablas de frecuencias de las variables, que constan de los siguientes
elementos: valores vlidos o las categoras, su frecuencia absoluta (frecuencia), la
frecuencia percentual (porcentaje), la frecuencia percentual sin contabilizar los valores
perdidos (porcentaje vlido) y la frecuencia percentual acumulada (porcentaj e
acumulado) basada en el porcentaje vlido. Para pedir esta tabla desde el SPSS se hace
mediante la opcin analizar / estadsticos descriptivos / frecuencias.
Adems de las tablas de frecuencias tambin podemos hacer uso de las tablas de
contingencia y otras tablas donde cruzar ms de una variable. Una tabla de contingencia
es una tabla donde situar las frecuencias en el interior, en funcin de dos variables con
dos o ms categoras cada una. Por ejemplo, en la tabla 1, se presenta una tabla de
contingencia sobre las frecuencias observadas de las diferentes categoras profesionales,
en funcin del sexo.
Tabla 1 Ejemplo de tabla de contingencia obtenida con el SPSS
Tabla de contingencia Sexo del encuestado * Categora ocupacional
Recuento
160 179 339
122 334 456
57 147 204
26 10 36
136 27 163
120 100 220
621 797 1418
Direcctivo o profesional liberal
Empleado tcnico, administrativo o comercial
Servicios
Agricultura, forestal y pesca
Produccin de precisin, manufactura o reparacin
Operario, fabricacin y mano de obra en general
Categora
ocupacional
Total
Hombre Mujer
Sexo del encuestado
Total
El SPSS nos ofrece crear tablas de contingencia desde la opcin analizar / estadsticos
descriptivos / tablas de contingencia; donde inclusive tenemos la opci de pedir grficos
agrupados en funcin de las variables que se representan en la tabla.
Tambin se pueden representar estadsticos en el interior de una tabla, en funcin de
diferentes variables categricas. Imaginemos que nos agradara hacer una tabla donde
representar el promedio (media aritmtica) del nmero de hijos que tienen las personas
en funcin de su categora profesional. Este ejemplo es el que presentamos en la tabla 2.
Universitat de Barcelona
Institut de Cincies de l'Educaci
Secci de Recerca
Butllet LaRecerca
ISSN: 1886-1946 / Dipsit legal: B.20973-2006
Ficha 6. Junio 2006
Vil, Ruth
Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS?
5
Tabla 2 Ejemplo de tabla donde se resumen las medias aritmticas de una variable en funcin de otra
3
3
5
4
4
5
N de hijas e hijos Direcctivo o profesional liberal
N de hijas e hijos Empleado tcnico,
administrativo o comercial
N de hijas e hijos Servicios
N de hijas e hijos Agricultura, forestal y pesca
N de hijas e hijos Produccin de precisin,
manufactura o reparacin
N de hijas e hijos Operario, fabricacin y mano
de obra en general
Categora
ocupacional
El SPSS nos ofrece crear este tipo de tablas, a travs de analizar/tablas/tablas bsicas.
No obstante, tambin se pueden crear a travs de la opcin de tablas generales, el
proceso es muy similar. En ambos casos, cuando se pide la variable a resumir se trata de
ofrecer la variable cuantitativa de la que deseemos obtener la media aritmtica, en el
ejemplo anterior, correspondra a la variable n de hijos/as. Por otro lado, los subgrupos
los haramos gracias a variables habitualmente cualitativas como en el ejemplo, la
categora profesional.
Las tcnicas de representacin grfica son otro instrumento para reducir la informacin
original. La prdida de informaci es mayor, pero presenta la ventaja de establecer
diferencias entre dos distribuciones a simple vista. Para la representacin grfica es
necesario diferenciar si la variable es cualitativa (fruto de la observacin como el sexo o
el estado civil) o cuantitativa (fruto de una medida como la edad o el peso). As, para las
variables cualitativas son adecuados los grficos siguientes: Ciclograma o de sectores o
el diagrama de barras. Las variables cuantitativas, en cambio, se representan
grficamente, entre otros, con el polgono de frecuencies o el histograma. Todos ellos se
pueden obtener en el SPSS desde la opcin del men grficos.
Indicadores estadsticos
Las representaciones grficas ofrecen al investigador/a un mtodo elemental para el
anlisis de las propiedades del objecte de estudio; se necesitan otros mtodos ms
precisos para el estudio de las caractersticas ms importantes de las distribuciones de
frecuencias. Para ello disponemos de los indicadores estadsticos, que nos permitirn dar
respuesta a cuestiones como las siguientes: cmo estn los valores ordenados?
(indicadores de posicin), cmo se concentran los valores? (indicadores de tendencia
central), cmo se dispersan o qu variabilidad hay? (indicadores de dispersin) y qu
forma adopta la distribucin? (indicadores de forma). Bsicamente, con uno solo de estos
indicadores no podemos llegar a describir a la perfeccin toda una serie numrica, sino
que como mnimo, a la hora de sintetizar una distribucin, debemos hacer uso de todos
estos diferentes tipos de indicadores estadsticos.
Desde el SPSS se puede hacer este anlisis en la opcin Frecuencias
1
para los siguientes
estadsticos descriptivos:
Indicadores de tendencia central: media aritmtica, error tpico de la media,
moda
2
y mediana.

1
La opcin Frecuencias se obtiene desde la opcin Analizar del men principal donde se ejecutan todos los
anlisis estadsticos, en la opcin de Estadsticos descriptivos.
Universitat de Barcelona
Institut de Cincies de l'Educaci
Secci de Recerca
Butllet LaRecerca
ISSN: 1886-1946 / Dipsit legal: B.20973-2006
Ficha 6. Junio 2006
Vil, Ruth
Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS?
6
Indicadores de dispersin: varianza, desviacin tpica, rango, mnimo y mximo.
Indicadores de posicin: cuartiles, deciles y percentiles
3
.
Indicadores de forma: asimetra y su error tpico, curtosis y su error tpico.
Hay diversas maneras de obtener estos clculos desde el SPSS, una de las ms sencillas
es desde la opcin analizar/estadsticos descriptivos/frecuencias, siguiendo los pasos que
se detallan en la figura 2.
Fig.2 Pasos para calcular indicadores estadsticos desde el SPSS

2
El SPSS nos da un nico valor modal, tanto si se trata de distribuciones unimodales, bimodales, como
multimodales. Concretamente, cuando estamos delante de distribuciones con ms de una moda, el output ofrece
el valor modal ms pequeo.
3
El output siempre da percentiles, aunque tiene la opcin de pedir cualquiera de los indicadores deciles o
cuartiles, ya que su equivalencia es sencilla.
1
2
Universitat de Barcelona
Institut de Cincies de l'Educaci
Secci de Recerca
Butllet LaRecerca
ISSN: 1886-1946 / Dipsit legal: B.20973-2006
Ficha 6. Junio 2006
Vil, Ruth
Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS?
7
Para profundizar en estos elementos, se recomienda consultar algunos manuales de
estadstica bsica que explican con mayor detalle aspectos de estadstica descriptiva (Por
ejemplo: Visauta i Batall, 1991).
Documentacin
Alvarez, M. (2000). Anlisis estadstico con SPSS: procedimientos bsicos. Bilbao:
Deusto.
Bisquerra, R. (1987). Introduccin a la estadstica aplicada a la investigacin educativa.
un enfoque informtico con los paquetes BMDP y SPSS-X. Barcelona: PPU.
Boadas, J. (1995). Fundamentos de estadstica. Barcelona: UPC.
Bryman, A., y Cramer, D. (1995). Quantitative data analysis for social scientist. London:
Routledge.
Calvo, F. (1994). Estadstica aplicada. Bilbao: Deusto.
Camacho, J. (2000). Estadstica con SPSS. Madrid: Ra-Ma.
Cuadras, C., Echeverra, B., Mateo, J., y Snchez, P. (1996). Fundamentos de
estadstica. Aplicacin a las ciencias humanas. Barcelona: PPU.
Domnech, J. M., y Granero, R. (2002a). Anlisi de dades per a recerca en psicologia.
Fonaments. Barcelona: Signo.
Domnech, J. M., y Granero, R. (2002b). Anlisi de dades per a recerca en psicologia.
Models estadstics bsics ( Vol. 2). Barcelona: Signo.
Filgueira, E. (2001). Anlisis de datos con SPSSWIN. Madrid: Alianza editorial.
Gil, J. (2003). La estadstica en la investigacin educativa. Revista de Investigacin
Educativa, 21(1), 231-248.
Gondar, J. E. (2002). Tcnicas estadsticas con SPSS. Madrid: Data mining institute.
Hartwig, F., y Dearing, B. E. (1987). Exploratory data analysis. Beverly Hills: Sage.
Hoaglin, D., Mosteller, F., y Tukey, J. W. (1991). Fundamentals of exploratory analysis of
variance. New York: Wiley.
Hopkins, K. D., Hopkins, B. R., y Colass, G. V. (1997). Estadstica bsica para las ciencias
sociales y del comportamiento. Mxico: Prentice Hall.
Lizasoain, L., y Joaristi, L. (1998). SPSS para windows. Madrid: Paraninfo.
Lomax, R. G. (2001a). An introduction to statistical concepts for education and
behavioral sciences. New Jersey: LEA.
Universitat de Barcelona
Institut de Cincies de l'Educaci
Secci de Recerca
Butllet LaRecerca
ISSN: 1886-1946 / Dipsit legal: B.20973-2006
Ficha 6. Junio 2006
Vil, Ruth
Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS?
8
Lomax, R. G. (2001b). Statistical concepts. A second course for education and the
behavioral sciences. New Jersey: LEA.
Norusis, M. J. (2000). SPSS 10.0: guide to data analysis. New Jersey: Prentice Hall.
Pardo, A., y Ruiz, M. A. (2002). SPSS 11. Gua para el anlisis de datos. Madrid:
McGraw-Hill.
Spiegel, M. (1991). Estadstica. Madrid: McGrawHill.
Visauta, B. (1997). Anlisis estadstico con SPSS para windows. ( Vol. 1. Estadstica
bsica). Madrid: McGraw-Hill.
Visauta, B., y Batall, P. (1991). Mtodos estadsticos aplicados. Estadstica descriptiva.
Barcelona: PPU.
Vil, R., y Bisquerra, R. (2004). El anlisis cuantitativo de los datos. En R. Bisquerra
(Ed.), Metodologa de la investigacin educativa. Madrid: La Muralla.

También podría gustarte