Secci de Recerca Butllet LaRecerca ISSN: 1886-1946 / Dipsit legal: B.20973-2006 Ficha 6. Junio, 2006 1 Fichas para investigadores ________________________________________________________________ Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS? ________________________________________________________________ Autora: Vil Baos, Ruth. Departament de Mtodes d'investigaci i Diagnstic en Educaci. Universitat de Barcelona. El anlisis cuantitativo de datos mediante la informtica estadstica En la actualidad es difcil hablar de procesos estadsticos de anlisis cuantitativo de datos sin hacer referencia a la informtica aplicada a la investigacin. Estos recursos informticos se basan a menudo en paquetes de programas informticos que tienen por objetivo ayudar al/la investigador/a en la fase de anlisis de datos. En estos momentos uno de los paquetes ms perfeccionados y completos es el SPSS (Statistical Package for the Social Sciences). El SPSS es un paquete de programas para llevar a cabo el anlisis estadstico de los datos. Constituye una aplicacin estadstica muy potente, de la que se han ido desarrollando diversas versiones desde sus inicios, en los aos setenta. En esta ficha las salidas de ordenador que se presentan corresponden a la versin 11.0.1. No obstante, aunque la forma ha ido variando desde sus inicios, su funcionamiento sigue siendo muy similar entre las diferentes versiones. Antes de iniciarnos en la utilizacin de las aplicaciones del SPSS es importante familiarizarse con algunas de las ventanas que ms usaremos. Al entrar al SPSS lo primero que nos encontramos es el editor de datos. Esta ventana visualiza, bsicamente, los datos que iremos introduciendo. El editor de datos incluye dos opciones: la vista de los datos y la de las variables. Estas opciones pueden seleccionarse a partir de las dos pestaas que se presentan en la parte inferior. La vista de datos contiene el men general y la matriz de datos. Esta matriz est estructurada ubicando los casos en las filas y las variables en las columnas. La matriz de datos En una investigacin, una vez finalizado el proceso de recogida de datos, toma protagonismo la creacin de la matriz de datos (que se encuentra en el visor de edicin de datos del SPSS). Una matriz de datos es una estructura en forma de tabla que contiene los valores de cada sujeto en las diferentes variables. Habitualmente se colocan las variables en las columnas y los individuos en las filas, aunque no tienen por qu coincidir el nmero de variables con el de columnas, o el nmero de filas con el nmero de individuos. Crear la matriz de datos implica definir las variables que se consideran para el estudio e introducir los datos recogidos. La vista de variables nos permite hacer especificaciones Universitat de Barcelona Institut de Cincies de l'Educaci Secci de Recerca Butllet LaRecerca ISSN: 1886-1946 / Dipsit legal: B.20973-2006 Ficha 6. Junio 2006 Vil, Ruth Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS? 2 sobre las variables que contiene nuestra matriz de datos. En esta ventana las diferentes variables se encuentran situadas en las filas, mientras que las caractersticas a definir de las mismas se encuentran en las columnas. Concretamente, podemos definir los siguientes aspectos de cada una de las variables del estudio: - El nombre de la variable lo utilizaremos para visualizarlo en la matriz y, por tanto, nos interesa un nombre corto (mximo de 8 dgitos) que nos identifique cada una de las variables. - El tipo de variable nos permite distinguir si la variable es numrica o alfanumrica. - En la amplitud de la variable podemos definir el nmero de dgitos que contempla esta variable en la matriz de datos. - Los decimales suponen definir el nmero de decimales que contiene la variable. - En la etiqueta de la variable podemos proporcionar un nombre ms largo y especfico que identifique el contenido de la variable que generemos. Esta etiqueta es la que aparecer en las salidas de resultados. En caso de no definirla se utiliza por defecto el nombre de la variable. - Los valores de la variable se utilizan por aquellas variables cualitativas que disponen de categoras. Por ejemplo, el sexo tiene las categoras "femenino" y "masculino". En este caso, hacemos clic en la opcin de valores y en el cuadro de dilogo que surja podemos especificar los valores numricos y su correspondiente etiqueta de valor. Despus de cada una de las especificaciones es necesario darle a agregar. - Los valores perdidos son aquellos valores que no se tienen en cuenta para el anlisis de los resultados. El SPSS identifica dos tipos: los perdidos por el sistema (cualquier casilla en blanco dentro de la matriz de datos) y los perdidos por el usuario. En este ltimo caso es el usuario el que define cules son estos valores. En el cuadro de dilogo que aparece podemos escoger entre diferentes opciones: podemos definir valores perdidos que no sean consecutivos (valores perdidos discretos), o bien podemos definir un rango de valores perdidos ms un valor discreto opcional. Por ejemplo si en el sexo tenemos que 1 es femenino y 2 es masculino, podemos definir un rango de 3 a 999999 y un valor discreto 0, como valores perduts. - La opcin columna nos permite definir o modificar la amplitud que ocupa la columna para cada variable dentro de la vista de datos y no afecta en ningn caso la amplitud definida previamente. - La alineacin hace referencia a cmo se sitan los datos en la columna correspondiente dentro de la vista de datos (a la derecha, izquierda o centradas). - Por ltimo, debemos especificar el tipo de escala de medida que utilizaremos para cada variable. Aparece un men en el que podemos escoger la escala correspondiente: Escala, Ordinal o Nominal. Una vez que hemos definido todas las caractersticas de las variables del estudio podemos comenzar a introducir los datos dentro del editor de datos. Una vez elaborada la matriz de datos, pero de forma previa al anlisi propiamente dicho, es ms que recomendable hacer una primera revisin de los posibles errores que contenga la matriz y que puedan alterar los resultados del estudio que se pretende hacer. Para ello, disponemos de los procesos de depuracin de la matriz de datos. Estos procedimientos consisten en corregir dos posibles fuentes de error: errores en la correccin del instrumento de medida o bien errores en la transcripcin de los valores en la matriz de datos. Universitat de Barcelona Institut de Cincies de l'Educaci Secci de Recerca Butllet LaRecerca ISSN: 1886-1946 / Dipsit legal: B.20973-2006 Ficha 6. Junio 2006 Vil, Ruth Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS? 3 Fig. 1 Pasos para pedir estadsticos descriptivos en el SPSS para la depuracin de la matriz Depurar la matriz de datos consiste bsicamente en calcular algunos estadsticos descriptivos de todas las variables (en el SPSS se pueden pedir desde la opcin del men analizar/estadsticos descriptivos/frecuencias), como por ejemplo: Las frecuencias absolutas de cada una de las categoras o valores que toma la variable para verificar que no hay ningn valor ajeno a los valores lgicos de la variable. Por ejemplo con la variable sexo, podemos tener las dos categoras femenino y masculino. Si adems encontramos un valor numrico, podemos deducir que se trata de un error. El nmero de individuos de cada variable para verificar que sea correcto y que no se ha olvidado ni duplicado ningn individuo. El mnimo y el mximo (en la opcin de estadsticos del cuadro de dilogo) para verificar que no existan valores extremos que sobrepasen o no lleguen al rango lgico de la variable. Si tenemos la variable edad y la muestra es alumnado de primaria, se trataria de verificar que no exista ningn valor inferior a 6 aos o superior a 12, dado que seguramente sera un error. La depuracin de la matriz es bsica, ya que si no detectamos y corregimos estos posibles errores de transcripcin o correccin podran producirse graves errores en los resultados finales. Por otro lado, algunos de estos procesos de depuracin de la matriz se inician de forma previa a la introduccin de datos, con la misma definicin de las variables cuando se consideran los valores perdidos de cada una. Los valores perdidos del/la usuario/a se especifican para cada variable por parte de la persona investigadora. Considerando el rango posible de valores para las cuantitativas contnuas, se puede definir un intervalo de valores que se encuentren fuera de los lmites posibles de cada variable. Aquellos valores que manifestamos que son perdidos, no se consideran para el anlisi de datos, ya que podran alterarlo. 1 3 2 Universitat de Barcelona Institut de Cincies de l'Educaci Secci de Recerca Butllet LaRecerca ISSN: 1886-1946 / Dipsit legal: B.20973-2006 Ficha 6. Junio 2006 Vil, Ruth Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS? 4 El anlisis descriptivo Despus de la depuracin de la matriz de datos es frecuente dar prioridad a un anlisis exploratorio EDA (Exploratory Data Analysis) basado en el anlisis descriptivo de cada variable, que permite una mayor comprensin del fenmeno. Por este motivo, tiene una especial importancia la deteccin de outliers o sujetos con puntuaciones que se distancien notablemente de los modelos establecidos para el resto de individuos de la muestra. La estadstica descriptiva univariable da cuerpo al anlisis exploratorio de los datos, describiendo las caractersticas de un hecho, objecto o fenmeno. Este anlisis se puede efectuar desde una perspectiva ms visual mediante tablas y representaciones grficas; y desde una perspectiva ms analtica a travs de los indicadores estadsticos. Tablas y representaciones grficas El SPSS proporciona tablas de frecuencias de las variables, que constan de los siguientes elementos: valores vlidos o las categoras, su frecuencia absoluta (frecuencia), la frecuencia percentual (porcentaje), la frecuencia percentual sin contabilizar los valores perdidos (porcentaje vlido) y la frecuencia percentual acumulada (porcentaj e acumulado) basada en el porcentaje vlido. Para pedir esta tabla desde el SPSS se hace mediante la opcin analizar / estadsticos descriptivos / frecuencias. Adems de las tablas de frecuencias tambin podemos hacer uso de las tablas de contingencia y otras tablas donde cruzar ms de una variable. Una tabla de contingencia es una tabla donde situar las frecuencias en el interior, en funcin de dos variables con dos o ms categoras cada una. Por ejemplo, en la tabla 1, se presenta una tabla de contingencia sobre las frecuencias observadas de las diferentes categoras profesionales, en funcin del sexo. Tabla 1 Ejemplo de tabla de contingencia obtenida con el SPSS Tabla de contingencia Sexo del encuestado * Categora ocupacional Recuento 160 179 339 122 334 456 57 147 204 26 10 36 136 27 163 120 100 220 621 797 1418 Direcctivo o profesional liberal Empleado tcnico, administrativo o comercial Servicios Agricultura, forestal y pesca Produccin de precisin, manufactura o reparacin Operario, fabricacin y mano de obra en general Categora ocupacional Total Hombre Mujer Sexo del encuestado Total El SPSS nos ofrece crear tablas de contingencia desde la opcin analizar / estadsticos descriptivos / tablas de contingencia; donde inclusive tenemos la opci de pedir grficos agrupados en funcin de las variables que se representan en la tabla. Tambin se pueden representar estadsticos en el interior de una tabla, en funcin de diferentes variables categricas. Imaginemos que nos agradara hacer una tabla donde representar el promedio (media aritmtica) del nmero de hijos que tienen las personas en funcin de su categora profesional. Este ejemplo es el que presentamos en la tabla 2. Universitat de Barcelona Institut de Cincies de l'Educaci Secci de Recerca Butllet LaRecerca ISSN: 1886-1946 / Dipsit legal: B.20973-2006 Ficha 6. Junio 2006 Vil, Ruth Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS? 5 Tabla 2 Ejemplo de tabla donde se resumen las medias aritmticas de una variable en funcin de otra 3 3 5 4 4 5 N de hijas e hijos Direcctivo o profesional liberal N de hijas e hijos Empleado tcnico, administrativo o comercial N de hijas e hijos Servicios N de hijas e hijos Agricultura, forestal y pesca N de hijas e hijos Produccin de precisin, manufactura o reparacin N de hijas e hijos Operario, fabricacin y mano de obra en general Categora ocupacional El SPSS nos ofrece crear este tipo de tablas, a travs de analizar/tablas/tablas bsicas. No obstante, tambin se pueden crear a travs de la opcin de tablas generales, el proceso es muy similar. En ambos casos, cuando se pide la variable a resumir se trata de ofrecer la variable cuantitativa de la que deseemos obtener la media aritmtica, en el ejemplo anterior, correspondra a la variable n de hijos/as. Por otro lado, los subgrupos los haramos gracias a variables habitualmente cualitativas como en el ejemplo, la categora profesional. Las tcnicas de representacin grfica son otro instrumento para reducir la informacin original. La prdida de informaci es mayor, pero presenta la ventaja de establecer diferencias entre dos distribuciones a simple vista. Para la representacin grfica es necesario diferenciar si la variable es cualitativa (fruto de la observacin como el sexo o el estado civil) o cuantitativa (fruto de una medida como la edad o el peso). As, para las variables cualitativas son adecuados los grficos siguientes: Ciclograma o de sectores o el diagrama de barras. Las variables cuantitativas, en cambio, se representan grficamente, entre otros, con el polgono de frecuencies o el histograma. Todos ellos se pueden obtener en el SPSS desde la opcin del men grficos. Indicadores estadsticos Las representaciones grficas ofrecen al investigador/a un mtodo elemental para el anlisis de las propiedades del objecte de estudio; se necesitan otros mtodos ms precisos para el estudio de las caractersticas ms importantes de las distribuciones de frecuencias. Para ello disponemos de los indicadores estadsticos, que nos permitirn dar respuesta a cuestiones como las siguientes: cmo estn los valores ordenados? (indicadores de posicin), cmo se concentran los valores? (indicadores de tendencia central), cmo se dispersan o qu variabilidad hay? (indicadores de dispersin) y qu forma adopta la distribucin? (indicadores de forma). Bsicamente, con uno solo de estos indicadores no podemos llegar a describir a la perfeccin toda una serie numrica, sino que como mnimo, a la hora de sintetizar una distribucin, debemos hacer uso de todos estos diferentes tipos de indicadores estadsticos. Desde el SPSS se puede hacer este anlisis en la opcin Frecuencias 1 para los siguientes estadsticos descriptivos: Indicadores de tendencia central: media aritmtica, error tpico de la media, moda 2 y mediana.
1 La opcin Frecuencias se obtiene desde la opcin Analizar del men principal donde se ejecutan todos los anlisis estadsticos, en la opcin de Estadsticos descriptivos. Universitat de Barcelona Institut de Cincies de l'Educaci Secci de Recerca Butllet LaRecerca ISSN: 1886-1946 / Dipsit legal: B.20973-2006 Ficha 6. Junio 2006 Vil, Ruth Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS? 6 Indicadores de dispersin: varianza, desviacin tpica, rango, mnimo y mximo. Indicadores de posicin: cuartiles, deciles y percentiles 3 . Indicadores de forma: asimetra y su error tpico, curtosis y su error tpico. Hay diversas maneras de obtener estos clculos desde el SPSS, una de las ms sencillas es desde la opcin analizar/estadsticos descriptivos/frecuencias, siguiendo los pasos que se detallan en la figura 2. Fig.2 Pasos para calcular indicadores estadsticos desde el SPSS
2 El SPSS nos da un nico valor modal, tanto si se trata de distribuciones unimodales, bimodales, como multimodales. Concretamente, cuando estamos delante de distribuciones con ms de una moda, el output ofrece el valor modal ms pequeo. 3 El output siempre da percentiles, aunque tiene la opcin de pedir cualquiera de los indicadores deciles o cuartiles, ya que su equivalencia es sencilla. 1 2 Universitat de Barcelona Institut de Cincies de l'Educaci Secci de Recerca Butllet LaRecerca ISSN: 1886-1946 / Dipsit legal: B.20973-2006 Ficha 6. Junio 2006 Vil, Ruth Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS? 7 Para profundizar en estos elementos, se recomienda consultar algunos manuales de estadstica bsica que explican con mayor detalle aspectos de estadstica descriptiva (Por ejemplo: Visauta i Batall, 1991). Documentacin Alvarez, M. (2000). Anlisis estadstico con SPSS: procedimientos bsicos. Bilbao: Deusto. Bisquerra, R. (1987). Introduccin a la estadstica aplicada a la investigacin educativa. un enfoque informtico con los paquetes BMDP y SPSS-X. Barcelona: PPU. Boadas, J. (1995). Fundamentos de estadstica. Barcelona: UPC. Bryman, A., y Cramer, D. (1995). Quantitative data analysis for social scientist. London: Routledge. Calvo, F. (1994). Estadstica aplicada. Bilbao: Deusto. Camacho, J. (2000). Estadstica con SPSS. Madrid: Ra-Ma. Cuadras, C., Echeverra, B., Mateo, J., y Snchez, P. (1996). Fundamentos de estadstica. Aplicacin a las ciencias humanas. Barcelona: PPU. Domnech, J. M., y Granero, R. (2002a). Anlisi de dades per a recerca en psicologia. Fonaments. Barcelona: Signo. Domnech, J. M., y Granero, R. (2002b). Anlisi de dades per a recerca en psicologia. Models estadstics bsics ( Vol. 2). Barcelona: Signo. Filgueira, E. (2001). Anlisis de datos con SPSSWIN. Madrid: Alianza editorial. Gil, J. (2003). La estadstica en la investigacin educativa. Revista de Investigacin Educativa, 21(1), 231-248. Gondar, J. E. (2002). Tcnicas estadsticas con SPSS. Madrid: Data mining institute. Hartwig, F., y Dearing, B. E. (1987). Exploratory data analysis. Beverly Hills: Sage. Hoaglin, D., Mosteller, F., y Tukey, J. W. (1991). Fundamentals of exploratory analysis of variance. New York: Wiley. Hopkins, K. D., Hopkins, B. R., y Colass, G. V. (1997). Estadstica bsica para las ciencias sociales y del comportamiento. Mxico: Prentice Hall. Lizasoain, L., y Joaristi, L. (1998). SPSS para windows. Madrid: Paraninfo. Lomax, R. G. (2001a). An introduction to statistical concepts for education and behavioral sciences. New Jersey: LEA. Universitat de Barcelona Institut de Cincies de l'Educaci Secci de Recerca Butllet LaRecerca ISSN: 1886-1946 / Dipsit legal: B.20973-2006 Ficha 6. Junio 2006 Vil, Ruth Cmo hacer un anlisis cuantitativo de datos de tipo descriptivo con el paquete estadstico SPSS? 8 Lomax, R. G. (2001b). Statistical concepts. A second course for education and the behavioral sciences. New Jersey: LEA. Norusis, M. J. (2000). SPSS 10.0: guide to data analysis. New Jersey: Prentice Hall. Pardo, A., y Ruiz, M. A. (2002). SPSS 11. Gua para el anlisis de datos. Madrid: McGraw-Hill. Spiegel, M. (1991). Estadstica. Madrid: McGrawHill. Visauta, B. (1997). Anlisis estadstico con SPSS para windows. ( Vol. 1. Estadstica bsica). Madrid: McGraw-Hill. Visauta, B., y Batall, P. (1991). Mtodos estadsticos aplicados. Estadstica descriptiva. Barcelona: PPU. Vil, R., y Bisquerra, R. (2004). El anlisis cuantitativo de los datos. En R. Bisquerra (Ed.), Metodologa de la investigacin educativa. Madrid: La Muralla.