Está en la página 1de 45

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-1

UNIVERSIDAD DE JAN

Material del curso Anlisis de datos procedentes de investigaciones mediante programas informticos
Manuel Miguel Ramos lvarez
ndice

MATERIAL II BASES COMPUTACIONALES MATERIAL II BASES COMPUTACIONALES ATERIAL ASES OMPUTACIONALES

Bases informticas para el anlisis estadstico ..................................................... 2 2.1. 2.1.1. Programas de utilidad segn la etapa de anlisis ............................................ 3 2.1.2. Focalizacin en el programa SPSS ................................................................ 5 2.1.3. Ventanas bsicas del programa SPSS ........................................................... 6 2.1.4. Sistema de Mens en el programa SPSS ..................................................... 10 2.1.4.1. Generales ............................................................................................ 10 2.1.4.2. Datos .................................................................................................. 10 2.1.4.3. Transformar ......................................................................................... 11 2.1.4.4. Analizar ............................................................................................... 12 2.1.4.5. Grficos............................................................................................... 20 2.1.4.6. Generales II ......................................................................................... 21 2.1.4.7. Ayudas ................................................................................................ 21 2.2. Procesamiento inicial de los datos para una primera comprensin de los mismos.... 22 2.2.1. Introduccin a la Codificacin de variables................................................... 23 2.2.2. Estructura del fichero de datos .................................................................. 27 2.2.3. Ejemplificacin de la introduccin de datos a partir del Supuesto 2 mediante el programa Excel.................................................................................................... 28 2.2.4. Ejemplificacin de la introduccin de datos a partir del Supuesto 1 mediante el programa SPSS.................................................................................................... 31 2.2.5. Ejemplificacin de la introduccin de datos a partir del Supuesto 3 mediante el programa SPSS.................................................................................................... 32 2.2.6. Almacenamiento y edicin de los ficheros de datos ....................................... 34 2.2.7. Importacin de ficheros de datos a partir del Supuesto 2............................... 35 2.2.8. Incorporacin de nueva informacin a partir de los datos bsicos ................... 39 2.2.9. Seleccin de informacin (aplicacin de un filtro de datos)............................. 41

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-2

2.1. Bases informticas para el anlisis estadstico


o o Programas de utilidad segn la etapa de anlisis. Focalizacin en el programa SPSS.

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-3

2.1.1.

Programas de utilidad segn la etapa de anlisis

Una de las contribuciones ms importantes de los ordenadores a la ciencia en general: el gran impulso a la difusin de las tcnicas de anlisis de datos. El crecimiento de los paquetes estadsticos y su abaratamiento ha tenido consecuencias beneficiosas en cuanto a la ampliacin del nmero de tcnicas de anlisis disponibles Un inconveniente: los paquetes estadsticos han impuesto unas determinadas maneras de realizar los anlisis. Por ejemplo, algunos paquetes, como SPSS no permiten realizar pruebas no planeadas en variables manipuladas intra-sujetos.
mbito Procesam. inicial datos General General, Salud General, Educativa General, Experimen. EDA, Educativa Informacin http://www.microsoft.com/spain/support/
http://www.ujaen.es/sci/invdoc/soft/microinf/acuespe/officeXP/officeXP.html

Gua de los Programas de Anlisis


Programa Excel BMDP Win SAS Dispon. S -------------

http://www.statsol.ie/bmdp/bmdp.htm http://www.sas.com/technologies/analytics/statistics/

SAS/JMP (SAS/INSIGHT*)
SPSS Statistica SYSTAT

http://www.spss.com/ http://www.statsoft.com/ http://www.systat.com/

S S-------

Autosignal Peakfit TableCurve 2D, 3D Sigmaplot

STAT-GRAPHICS S-Plus Minitab Stata EQS

General, Experimen. No Lineal-EDA, Economa ModelizacinEDA Propsito general Ecuaciones estructurales Ecuaciones estructurales y Modelos Jerrquicos Series Temporales Series Temporales Programacin matemtica/ estadstica

http://www.statgraphics.com
http://www.ujaen.es/sci/invdoc/soft/microinf/acuespe/statg/statg5esp.html

S SS-------------------

www.insightful.com www.minitab.com http://www.stata.com/ http://www.mvsoft.com/products.htm http://www.ssicentral.com/sp.html

LISREL HLM RATS TSP GAUSS

http://www.estima.com/ http://www.tspintl.com/ http://www.aptech.com/

-------------------

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-4

Especialmente recomendables: http://www.statsoft.com/textbook/stathome.html http://www.stat.ucla.edu/textbook/ Software estadstico para programacin, de libre distribucin: http://www.r-project.org/ Pginas Web de autores destacados, que incluyen la implementacin de pruebas especficas mediante programas gratuitos. o Meta-anlisis: http://www.powerandprecision.com/ o Potencia estadstica: http://www.mvsoft.com/ o Rand Wilcox, Professor of Psychology at USC, has developed a set of S-Plus (as well as R) macros to accompany his book (and the upcoming new edition): Introduction To Robust Estimation and Hypothesis Testing Academic Press, 1997 and other. Los Macros: http://www-rcf.usc.edu/~rwilcox/ Enfocados en el anlisis cualitativo: Se puede acceder a los mismos a travs de una de las siguientes direcciones: www.provalisresearch.com http://socserv.mcmaster.ca/w3virtsoclib/software.htm Annotape. Is a system for recording, analysing and transcribing audio data for qualitative research ATLAS/ti. Is a software product for qualitative data analysis CAQDAS. Is the Computer Assisted Qualitative Data Analysis Software Networking Project HyperResearch. Is qualitative data analysis software package enabling you to code and retrieve, build theories, and conduct analyses of your data ITALASSI. Interaction Viewer for Regression Models Leximancer. Identifies key themes, concepts and ideas from unstructured text LOGISTIC. Logistic regression program (DOS) MVSP. Multivariate statistical analysis package ORIANA. Circular data statistical software PRACTICEMILL. Authoring and Testing Tool for Teachers and Trainers QDA MINER. Text management and qualitative analysis program QSR International offer three software products for qualitative data analysis. One of these is the most widely used QDA software product called NUD*IST (or N6), another is NVivo. Qualrus. Is a general-purpose qualitative analysis program which supports text and multimedia sources SIMSTAT. Statistical Analysis software TextAnalyst. Is a system for semantic text analysis and navigation. The Ethnograph. Is the second most widely used software for qualitative data analysis in the world. WordStat. Is a content analysis / qualitative analysis software product. Content Analysis & Text Mining module for Simstat or QDA Miner.

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-5

2.1.2.

Focalizacin en el programa SPSS

Sin duda uno de los paquetes que ms amplia aceptacin tiene es SPSS, un paquete cuyo interfaz de usuario ha mejorado considerablemente en las ltimas versiones. Sus ventajas fundamentales son incuestionables: o Facilidad de manejo, marcos y ventanas cuya organizacin facilita la comprensin del anlisis y su gran abanico de tcnicas estadsticas. En la mayora de los temas nuestra exposicin viene acompaada por los comandos de SPSS que son necesarios para lograr los objetivos de anlisis, acompaados por la salida que ofrece. o Adems se ha impuesto en el mercado, lo que contribuye a la unificacin (comparable a Windows como sistema operativo) y la continua actualizacin. o Unido a lo anterior, es previsible que proporcione cobertura tcnica a los usuarios en el futuro y que depure las ayudas y documentacin. Desventajas: o La organizacin de las tcnicas de anlisis y de las opciones grficas deja que desear, mezcla aproximacin estadstica clsica con la ms modera, lo que desemboca en un gran solapamiento de las opciones y tcnicas. o Impone estilos de anlisis que no estn justificados en la literatura estadstica especializada, como por ejemplo para los diseos de medidas repetidas o en el clculo de errores globales en el anlisis detallado tipo ANOVA. o Su elevado coste. La licencia bsica es muy costosa y adems expira en un ao. o Unido a lo anterior, gran cantidad de tcnicas de anlisis especializados hay que adquirirlas con un coste adicional que sigue siendo elevado. Disponibilidad en la Universidad Jan: http://www.ujaen.es/sci/invdoc/soft/microinf/acuespe/spss/spss11.html http://www.ujaen.es/sci/invdoc/soft/microinf/acuespe/spss/amos50.html Donde por un coste muy bajo se puede adquirir una licencia para ordenador personal y renovar los cdigos todos los aos, gracias a la cobertura del servicio central de informtica. Mens de ayuda y tutoriales: C:\Archivos de programa\SPSS\tutorial\spsstut\introtut2.htm

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-6

2.1.3.

Ventanas bsicas del programa SPSS

Ventana Inicial del Programa

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-7

Ventana Principal del Programa Ttulo Mens Herramientas Edicin

rea Datos: Matricial

Desplazamientos

Opciones Datos Barra Estado

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-8

Ventana Anlisis Prototpica del Programa rea Variables Disponibles rea Definicin Variables rea Comandos y Opciones del Mdulo anlisis

rea Comandos y Opciones generales

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-9

Ventana Resultados Prototpica del Programa rea Ttulos rea Resultados segn ttulo elegido

rea Opciones Edicin

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-10

2.1.4.

Sistema de Mens en el programa SPSS Generales

Datos

10

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-11

Transformar

11

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-12

Analizar

A) Resumen de la informacin: Anlisis descriptivo-exploratorio

Para Ayudar en la creacin de tablas resumen del apartado de resultados, cuando se desea tantear los resultados con la lgica de ANOVA.

La Opcin de Resumen Descriptivo ms importante. Para Distribucin de Frecuencias (arpox clsica), la opcin de descripcin, EDA, Tablas de Contingencia para Diseos Categricos Anlisis especializados de escala de medida fuerte (Tipo Razn).

Generacin ms sofisticada de Tablas de Contingencia.

12

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-13

Para Ayudar nuevamente en la creacin de tablas resumen del apartado de resultados, pero cuando interesa agrupar segn muchas categoras ms que tantear los resultados.

13

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-14

B) Anlisis inferencial bsico: Modelo Lineal General: ANOVA y Regresin

Contraste de Hiptesis sobre la Media (Lineal-ANOVA) con enfoque clsico.

Anlisis del Modelo Lineal General. Una nica variable Dependiente. Ms de una variable dependiente. Diseos Intrasujetos o de medidas repetidas. Diseos especializados de Efectos Mixtos (algunas vv, independientes son de efectos fijos y algunas de efectos aleatorios).

Anlisis del Modelo Lineal General para diseos especializados como por ejemplo Covariados o Factoriales Mixtos Complejos.

14

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-15

Anlisis de tipo Regresin con enfoque clsico. Dos variables Controlando el influjo de terceras variables. Distancias que intervienen en clculos de residuales y sobre todo del tipo Multivariado (como la Distancia Eucldea).

Anlisis de tipo Regresin segn el enfoque del Modelo Lineal para diseos correlaciones (Cuadrante 1) pero mezcla tambin el Modelo Lineal Generalizado para diseos categricos espacialmente para regresin logstica (Cuadrantes 2 y 4), as como opciones No Lineales (Cuadrante 3).

15

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-16

C) Anlisis de los supuestos del Modelo y pruebas alternativas No Paramtricas

Compendio de pruebas No paramtricas con distinta finalidad (ver el cuadro clasificatorio de pruebas No Paramtricas).

D) Generalizacin al diseo categrico

Anlisis de diseos categricos desde el punto de vista del enfoque del Modelo Lineal, permitiendo obtener el Modelo ptimo que mejor ajusta a los datos.

16

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-17

E) Anlisis avanzado: Tcnicas Multivariantes

Anlisis del tipo Clster y Discriminante para clasificar datos segn los casos o las variables. Por ejemplo se extraen 5 agrupaciones a partir de insectos de diferentes tipos.

Anlisis del Factorial con un objetivo descriptivo avanzado. Por ejemplo, un conjunto de 100 indicadores de calidad se resume (reduce) a partir de 6 factores.

17

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-18

Anlisis de escalas de utilidad en Ciencias de corte comportamental, social y educativo Por ejemplo, anlisis de la fiabilidad o exactitud de una medida.

18

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-19

Anlisis de series temporales (muchas medidas a travs del tiempo), especialmente con aproximacin ARIMA basada en autorregresin. Por ejemplo abstraer el modelo que subyace al patrn de las medidas de una sustancia contaminante a travs de los registros de todo un ao.

Anlisis de supervivencia, de aplicacin en el mbito de Ciencias de la Salud en el que interesa estudiar los datos que van quedando con el transcurso del tiempo o tras la aplicacin de programas de tratamiento.

19

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-20

Grficos

Los tipos de representaciones Grficas en SPSS A

A) Tipo Histograma B) Tipo Polgono Frecuencias C) Tipo Diagrama Simblico D) Tipo Diagrama Dispersin E) Tipo EDA F) Fines Especficos: Para Series Temporales, barras de error o para Control Calidad

20

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-21

Generales II

Ayudas

Volver Principio

21

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-22

2.2. Procesamiento inicial de comprensin de los mismos


o o

los

datos

para

una

primera

Creacin de ficheros de datos: codificacin de variables, gestin, importacin, almacenamiento Incorporacin de nueva informacin a partir de los datos bsicos

22

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-23

2.2.1.

Introduccin a la Codificacin de variables

La medicin de variables mtricas o cuantitativas requiere fundamentalmente de la asignacin de cdigos (casi siempre numricos) que reflejen los cambios cuantitativos. En comparacin, cuando se mide una variable categrica el proceso no es tan directo puesto que tenemos que codificar dicha variable mediante valores numricos, aunque la codificacin no puede ser cualquiera. Puede utilizarse cualquier esquema de codificacin siempre que se emplee de manera sistemtica. El esquema es una cuestin realmente arbitraria. Sin embargo, hay esquemas que son preferibles, puesto que facilitan la comprensin de los datos, evitan errores interpretativos y adems son ms slidos a efectos del clculo numrico. Se han impuesto tres sistemas de codificacin: sistema de efectos, ficticio (dummy) y de contrastes. Hay autores que manifiestan sus preferencias por el de contrastes (v.gr. los manuales enfocados a regresin), otros por el de efectos (v.gr. enfocados al ANOVA) y otros al sistema ficticio (v.gr. los que tienen un enfoque al anlisis categrico). El sistema no afectar a los estadsticos finales del anlisis inferencial pero s a la interpretacin de los parmetros. Principios generales que nos sern de utilidad: o La suma de los coeficientes adjudicados tiene que ser cero. o El sistema incluir tantos contrastes como grados de libertad tenga la variable a codificar, es decir nmero de niveles menos uno. o Para la interaccin basta con multiplicar entre s los coeficientes adjudicados a cada una de las variables implicadas en la configuracin. Ejemplos destacados: o Si tenemos un grupo de control que deseamos comparar con el resto entonces podramos decantarnos por el sistema ficticio, de forma que la categora de referencia coincida precisamente con el nivel neutral. o El mejor sistema (y el nico) para abordar el anlisis de tendencias o funciones polinmicas es el de contrastes.

23

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-24

Introduccin a la codificacin de variables-II Sistema de Efectos El objetivo es obtener el cambio de cada nivel con respecto a la gran media del diseo. Para ello fijamos un nivel y le asignamos el coeficiente unitario. Posteriormente vamos comparando dicha categora con las restantes una a una, asignando a la otra categora el valor -1. En consecuencia habr siempre un nivel con el valor cero y por lo tanto su efecto se puede deducir a partir de las otras. Diseo unifactorial, a=2
A

a1 a2

1 -1
A1 A2

Diseo unifactorial, a=3 a1 a2 a3 1 -1 0 1 0 -1


A

Diseo factorial 2x3 b1 a1


B1

b2 -1 1 -1

b3 0 0 0

1 -1 1

1 -1 a1b1 a1b2 a1b3 a2b1 a2b2 a2b3

B1

B2

A*B1

A*B2

a2

1 1 1 -1 -1 -1

1 -1 0 1 -1 0

1 0 -1 1 0 -1

1 -1 0 -1 1 0

1 0 -1 -1 0 1

b1 a1
B2

b2 0 0 0

b3 -1 1 -1

1 -1 1

1 -1

a2

24

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-25

Introduccin a la codificacin de variables-III Sistema ficticio (dummy) El objetivo es obtener el cambio de cada nivel con respecto a alguno que se fija como punto de referencia. Para ello fijamos un nivel y le asignamos el coeficiente nulo. Posteriormente vamos asignando el coeficiente unitario a los niveles restantes. De nuevo habr siempre un nivel con el valor cero y por lo tanto su efecto se puede deducir a partir de las otras. Diseo unifactorial, a=2
A

a1 a2

0 1
A1 A2

Diseo unifactorial, a=3 a1 a2 a3 0 1 0 0 0 1


A

Diseo factorial 2x3 b1 a1


B1

b2 0 1 1

b3 0 0 0

0 0 0

0 1 a1b1 a1b2 a1b3 a2b1 a2b2 a2b3

B1

B2

A*B1

A*B2

a2

0 0 0 1 1 1

0 1 0 0 1 0

0 0 1 0 0 1

0 0 0 0 1 0

0 0 0 0 0 1

b1 a1
B2

b2 0 0 0

b3 0 1 1

0 0 0

0 1

a2

25

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-26

Introduccin a la codificacin de variables-IV Sistema de contrastes El objetivo es descomponer las variables de manera ortogonal. Obviamente se puede emplear el sistema ortogonal deseado pero para uniformar toda la exposicin vamos a emplear el del Helmert, tomando nuevamente como punto de referencia el primer nivel de la variable. En este sistema obtenemos comparabilidad directa entre los niveles pero de manera que en algunos contrastes se promedian diferentes niveles. Nuevamente, si deseamos deshacer dichas agrupaciones entonces tenemos que ir sumando contrastes para deducir unos a partir de los otros. Diseo unifactorial, a=2
A

a1 a2

1 -1
A1 A2

Diseo unifactorial, a=3 a1 a2 a3 2 -1 -1 0 1 -1


A

Diseo factorial 2x3 b1 a1


B1

b2 -1 1 -1

b3 -1 1 -1

2 -2 2

1 -1 a1b1 a1b2 a1b3 a2b1 a2b2 a2b3

B1

B2

A*B1

A*B2

a2

1 1 1 -1 -1 -1

2 -1 -1 2 -1 -1

0 1 -1 0 1 -1

2 -1 -1 -2 1 1

0 1 -1 0 -1 1

b1 a1
B2

b2 1 -1 1

b3 -1 1 -1

0 0 0

1 -1

a2

Helmert. Define un tipo de contraste ortogonal, segn el cual se compara un nivel con todos los posteriores. En cada contraste se van anulando los que ya han sido comparados con el resto. Por ejemplo, para una var.ind. con 4 niveles, la matriz o conjunto de contrastes podra ser la siguiente: a1 a2 a3 a4 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1

26

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-27

2.2.2.

Estructura del fichero de datos

Los datos se deben de organizar segn una estructura particular que es la que actualmente emplean la mayora de los programas de anlisis estadstico. En general, cada unidad de anlisis (sujetos, casos) ocupa una fila diferente y slo una. Adems, las variables manipuladas entregrupos se codifican en columnas, una por cada variable. Finalmente los niveles de las variables manipuladas intrasujetos ocupan diferentes columnas, una por cada nivel de dicha variable. De manera equivalente, si se mide en ms de una variable dependiente, entonces cada una de las mismas se corresponde con una columna.

27

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-28

2.2.3. Ejemplificacin de la introduccin de datos a partir del Supuesto 2 mediante el programa Excel
Columna A: Var.Indep Mes Columna B: Var.Indep Tipo Columna C: Var. Dep Frecuencia Columnas D a F: Codifica Mes Columna G: Codifica Tipo Columnas H a J: Codifica Interacc

Casos en filas

28

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-29

Supongamos que alternativamente hubiramos introducido los datos con SPSS y el resultado fuera el que se muestra a continuacin:

Ahora el objetivo es definir el significado de la codificacin de una variable nominal como es el caso del mes. Para ello podemos cambiar la definicin de variables pulsando sobre la pestaa inferior [Vista de variables], entonces indicamos que la variable mes es del tipo Numrico y procedemos a definir el significado de las etiquetas nominales, lo que nos llevara a la ventana:

As procederamos con lo 4 valores e iramos aadiendo hasta obtener:

29

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-30

Finalmente indicar que en la ventana principal de Edicin de datos existe un botn de ) que nos permite visualizar los cdigos o bien sus etiquetas y que herramienta ( apareca indicado con una flecha en las imgenes precedentes.

30

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-31

2.2.4. Ejemplificacin de la introduccin de datos a partir del Supuesto 1 mediante el programa SPSS
En la ventana del editor de datos procedemos como en Excel, de manera matricial y el resultado quedara como sigue:

31

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-32

Adems, si pulsamos en la pestaa inferior de Vista de variables, podemos definir las caractersticas de las mismas, tal y como en la imagen:

Ejemplo para Humanidades:

Ejemplo para Ciencias:

Fundamentalmente resaltar las opciones de valores y Medida. La ltima hace referencia a la escala de medida segn la taxonoma de Stevens y el campo de valores nos permite definir la significacin de los cdigos numricos empleados para la codificacin, como en el ejemplo del apartado precedente.

2.2.5. Ejemplificacin de la introduccin de datos a partir del Supuesto 3 mediante el programa SPSS
En la ventana del editor de datos procedemos como en los dos supuestos precedente y el resultado quedara ahora como sigue:

32

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-33

De nuevo editamos la vista de variables y obtenemos lo siguiente:

Ejemplo para Humanidades:

Ejemplo para Ciencias:

En el campo dedicado a las etiquetas hemos introducido el significado de las mismas, 80 vs 90 vs 100.

33

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-34

2.2.6.

Almacenamiento y edicin de los ficheros de datos

Una vez introducidos los datos y definidas las variables, procedemos a almacenarlas en un fichero tal y como se hara en cualquier programa del entorno Windows: [Archivo|Guardar] o bien [Archivo|Guardar como]. En el ejemplo los ficheros se han denominado CSPSS_Sup1.sav, CSPSS_Sup2.sav y CSPSS_Sup3.sav, respectivamente para nuestros tres supuestos. Por otro lado, podemos aadir casos en filas o variables en columnas en cualquier momento que lo deseemos, basta con seleccionar con el ratn la fila o columna correspondiente y pulsar el botn secundario del ratn. Y para intercalar una variable:

Por ejemplo para aadir un caso intercalado:

34

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-35

2.2.7.

Importacin de ficheros de datos a partir del Supuesto 2

Una buena costumbre es trabajar en un programa de propsito general, como por ejemplo Excel, para introducir los datos y poder inspeccionarlos. Entonces posteriormente se llevarn al programa SPSS mediante la opcin de importacin automtica de la que dispone. Puesto que los datos del fichero para el supuesto 2 se crearon en Excel, nos servir como ejemplo. El fichero de Excel se llama CSPSS_Supuestos.xls y contiene en realidad tres hojas de clculo, de las cuales ahora nicamente nos interesa la del 2 supuesto. Con el editor de datos de SPSS en blanco, pulsamos [Archivo|Abrir|Datos], entonces especificamos el tipo de datos para Excel y el nombre del fichero:

Posteriormente seleccionamos la hoja de trabajo y le indicamos que lea el nombre de las variables en el primera fila de datos:

35

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-36

Alternativamente, supongamos que los datos en realidad se encontraban en un fichero de texto sencillo tipo ASCII (que se puede editar meramente con el Bloc de Notas de Windows) y adems con los datos divididos en dos ficheros: CSPSS_Sup2a.txt y CSPSS_Sup2b.txt, uno por cada tipo de riachuelo. Pues bien, empezamos importando el primero de los ficheros como antes, lo nico que cambia es el formato (ahora texto) y el hecho de que los datos se encuentran separados mediante el carcter ; pero evidentemente podramos haber elegido otro tipo de separador. En definitiva:

36

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-37

37

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-38

Y ya podemos pulsar en el comando [Finalizar]. Guardamos el fichero resultante con formato de SPSS y realizamos exactamente la misma operacin con el otro fichero de texto que contiene la segunda parte de los datos, con lo cual llegamos a los ficheros CSPSS_Sup2a.sav y CSPSS_Sup2b.sav. Ahora procedemos a la fusin, mediante el comando [Datos|Fundir archivos|Aadir casos]. Entonces, si tenamos activo el fichero CSPSS2_Sup2b.sav, le decimos al programa que fusione el otro fichero, es decir CSPSS2_Sup2a.sav. Obviamente tambin se puede efectuar a la inversa. Lo ms importante es especificar (si las hubiera) cules son las variables que no coinciden en ambos ficheros. El resultado:

38

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-39

2.2.8. Incorporacin de nueva informacin a partir de los datos bsicos


Aunque hemos simplificado tremendamente las opciones de gestin de ficheros del programa SPSS, centrando lo ms importante, se ha indicado lo ms relevante para poder tener una base razonable. Hasta aqu hemos vistos todo lo que atae a los datos originales, pero con frecuencia es necesario incluir nuevas variables que surgen a partir de otras originales, mediante alguna transformacin. En lo que sigue ejemplificaremos esta tarea para el Supuesto 1. Supongamos que nuestro objetivo es transformar la variable X1 en otra nueva que corresponda con su inversa, es decir queremos aplicar la transformacin:

X 1' =

Pues bien, con el fichero oportuno CSPSS2_Sup1.sav activo, primero creamos una nueva variable y le damos incluso un nombre, InvX1, entonces pulsamos [Transformar|Calcular] y nos aparece la ventana principal de transformaciones que constituye un asistente:

1 1 ; InvX 1 = X1 X1

Ejemplo para Humanidades:

39

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-40

Ejemplo para Ciencias:

A la izquierda se expresa la variable destino y a la derecha la expresin adecuada. Esta opcin es bastante poderosa y el investigador debe familiarizarse con ella. Tenemos operadores algebraicos bsicos, operadores lgicos por ejemplo para aplicar una transformacin nicamente a una parte de los datos (i.e. a un solo grupo), as como funciones estadsticas y matemticas bastante sofisticadas (en la parte derecha bajo funciones). En los mdulos posteriores, al hablar de las transformaciones de los datos volveremos sobre esta opcin.

40

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-41

2.2.9.

Seleccin de informacin (aplicacin de un filtro de datos)

Finalmente, dada la tremenda utilidad, expondremos la forma de seleccionar un determinado conjunto de datos a partir del fichero completo de los mismos. Por ejemplo, volviendo al Supuesto 2, supongamos que en este momento nicamente nos interesa analizar los datos del primero de los meses (Valor de la variable = 1 y Etiqueta = Diciembre) y obviar el resto.

41

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-42

Ejemplo para Humanidades: Volvemos al fichero relevante, CSPSS_Sup2.sav y pulsamos [Datos|Seleccionar casos ]

42

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-43

En la ventana que se despliega indicamos la opcin [Si se satisface la condicin] y pulsamos el botn [S], para pasar a definir el condicional que nos permite aplicar el filtro deseado (mes = 1), lo que quedara de la siguiente manera:

Pulsamos [Continuar] y de vuelta a la ventana previa [Aceptar], veremos que el programa es muy grfico pues nos tacha los casos excluidos en cada etiqueta de casos por filas. Hay que tener cuidado pues todos los anlisis se efectan nicamente con los casos seleccionados.

43

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-44

Ejemplo para Ciencias: Volvemos al fichero relevante, CSPSS_Sup2.sav y pulsamos [Datos|Seleccionar casos ]

44

Manuel Miguel Ramos lvarez

Curso de Anlisis de investigaciones con programas Informticos

II-45

En la ventana que se despliega indicamos la opcin [Si se satisface la condicin] y pulsamos el botn [S], para pasar a definir el condicional que nos permite aplicar el filtro deseado (mes = 1), lo que quedara de la siguiente manera:

Pulsamos [Continuar] y de vuelta a la ventana previa [Aceptar], veremos que el programa es muy grfico pues nos tacha los casos excluidos en cada etiqueta de casos por filas. Hay que tener cuidado pues todos los anlisis se efectan nicamente con los casos seleccionados.

Volver Principio

45

También podría gustarte