Está en la página 1de 33

1

GUA RPIDA DEL PROGRAMA SPSS ver. 13.0 a 15.0 Programa para estudios estadsticos en general, muy completo pero de fcil manejo.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

INDICE DEL CONTENIDO

1. PREPARACIN DE LA MATRIZ BSICA DE DATOS. 2. ESTANDARIZACIN DE LA MATRIZ BSICA DE DATOS. 3. ANLISIS DE COMPONENTES PRINCIPALES (DATOS CUANTITATIVOS). Pg. 5 Pg. 7 Pg. 9

3.1. Obtencin de los componentes principales sin rotar y rotados y el grfico de saturaciones factoriales. Pg. 9 3.2. Proyeccin de cada una de las UBC sobre los tres o dos primeros componentes principales. Pg. 14 4. ANLISIS DE AGRUPAMIENTOS PARA DATOS MULTI-ESTADO. Pg. 17 4.1. Agrupamiento en base a todos los caracteres analizados cuando estos son de tipo multiestado cualittativo o cuantitativos: Calcular y dibujar el dendrograma. Pg. 17 4.2. Agrupamiento en base a los primeros componentes principales (los que recogen una mayor variabilidad): Calcular y dibujar el dendrograma. Pg.25 4.3. Realizar un ANOVA para comprobar si los valores medios de cada cluster para cada carcter son significativamente diferentes. Pg. 26 4.3.1. Creacin de una nueva variable en la Matriz Bsica de Datos con el nmero de conglomerado al que pertenece cada UBC. Pg. 26 4.3.2. Realizacin del ANOVA tomando como variable dependiente el conglomerado de pertenencia y como variables independientes todos los caracteres analizados. Pg. 27 5. ANLISIS DE AGRUPAMIENTOS PARA DATOS DOBLE-ESTADO: CALCULAR Y DIBUJAR EL DENDROGRAMA. Pg. 32

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

1. PREPARACIN DE LA MATRIZ BSICA DE DATOS. El programa SPSS puede importar directamente matrices del programa Excel. La matriz no precisa codificacin especial. Sin embargo es importante que las variables (=caracteres) figuren en las columnas y los casos (=UBC) en las filas.

UBC

La importacin se realiza mediante los mens desplegables de SPSS como se muestra a continuacin.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

Una vez presionado Abrir se obtiene el Editor de datos que presenta dos pantallas, la primera es la vista de datos, ...

UBC

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

... y la segunda es la vista de variables

UBC

2. ESTANDARIZACIN DE LA MATRIZ BSICA DE DATOS. Si fuese necesario estandarizar la matriz de datos, la estandarizacin se hara por caracteres, ya que lo que se pretende es que los valores de todos los caracteres varen entre los mismos lmites. La estandarizacin ms habitual consiste en convertir cada valor en su puntuacin tpica, es decir, restarle el valor medio y dividirlo por su desviacin tpica. Para hacerlo de forma automtica se utilizar el mdulo de Estadsticos descriptivos, al que se accede a travs del men deplegable Analizar. Dentro de dicho mdulo seabrir el subprograma Descriptivos (Ver las figuras siguientes).

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

La pantalla que se obtiene es la que se presenta a continuacin.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

Si se precisan otros tipos de transformaciones de variables, como por ejemplo una transformacin logartmica, el consejo es realizar dichas transformaciones en MS Excel, y luego importar con SPSS el archivo resultante. Esto reduce las necesidades de aprendizaje de un nuevo programa.

3. 3.1.

ANLISIS DE COMPONENTES PRINCIPALES (DATOS CUANTITATIVOS). Obtencin de los componentes principales sin rotar y rotados y el grfico de saturaciones factoriales. En SPSS el ACP se encuentra dentro del mdulo Reduccin de datos, al que se accede a travs del men desplegable Analizar, en el subprograma Anlisis factorial.

Las variables que se utilizan en el anlisis factorial son los caracteres estandarizados o normalizados. La pantalla que se obtiene es la que se presenta a continuacin.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

10

Presionando el botn de Extraccin es preciso indicar En Mtodo: El mtodo factorial a utilizar: En este caso componentes principales. En Analizar debe elegirse si se quiere trabajar con la matriz de correlaciones entre caracteres o con la de varianzas-covarianzas. En Mostrar: Si se desea que la salida del programa muestre la solucin factorial antes de la rotacin y el grfico de sedimentacin. En Extraer: El nmero de factores principales que se desea que extraiga el programa, que puede estar en funcin de sus autovalores (eiguen-valores) o puede ser un nmero fijo.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

11

El botn de Rotacin sirve para realizar una rotacin de los Componentes Principales, en el caso en que se quiera realizar. Si as fuera es preciso indicar: En Mtodo: El mtodo de rotacin de los ejes ms habitual y que sigue dejando los ejes ortogonales es el Varimax. En Mostrar: Si se desea que la salida del programa muestre la solucin rotada y el grfico de proyeccin de los caracteres sobre los componentes principales, que es lo que se denomina Grfico de saturaciones. Si en Extraer (ver figura anterior) se indic que se extrajeran 3 o ms componentes el grfico ser 3-D; para 2 componentes ser 2-D.

Presionando el botn de Puntuaciones se puede solicitar que para cada Unidad Bsica de Caracterizacin (o caso) el programa guarde las coordenadas de sus proyecciones sobre los componentes principales. Para ello hay que activar la casilla Guardar como variables. Es necesario seleccionar el mtodo para obtener las puntaciones factoriales. S en el apartado Rotacin se solicit del programa algn tipo de rotacin, entonces las puntuaciones factoriales guardadas como variables sern los referidos a los componentes rotados.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

12

Una vez realizadas las operaciones anteriores, para la ejecucin del anlisis se presionar el botn Aceptar, como se indica en la siguiente figura.

En la pantalla de Resultados (pagina siguiente) la informacin que ms nos interesa es la siguiente: Comunalidades: Las comunalidades ms bajas correspondesa a aquellas variables peor explicadas por el anlisis. Varianza total explicada: Nos da informacin de los eiguen-valores de cada uno de los componentes principales. Grfico de sedimentacin: Explica como van disminuyendo los eiguen-valores de los componentes principales. Matriz de componentes: Da la informacin sobre los eiguen-vectores de cada carcter sobre cada uno de los componentes principales. Matriz de componentes rotados: Idem al caso anterior pero para los componentes rotados. Grfico de componentes de los factores 1, 2, 3: Proyecciones de los caracteres sobre los primeros componentes principales (mximo 3).

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

13

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

14

3.2. Proyeccin de cada una de las UBC sobre los tres o dos primeros componentes principales. A partir de la versin 15 se han mejorado los grficos y la interfaz es ahora la que se presenta a continuacin.

Los grficos interactivos son completamente intuitivos y de muy fcil manejo. Sin embargo la versin 15.0 mantiene lo que denomina Cuadros de dilogos antiguos que es la que se va a analizar a continuacin, para el caso de usuarios que utilicen versiones anteriores

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

15

Para obtener un diagrama tridimensinal de las UBC, en los Grficos antiguos de SPSS, es preciso acceder al submen Dispersin/puntos. Dentro del subprograma Dispersion/puntos se elegir Dispersin 3-D.

En el cuadro de dilogo resultante habr que introducir las puntuaciones factoriales de cada UBC (=caso) sobre los 3 primeros componentes principales. Para llevar a cabo esta accin, es preciso introducir en cada uno de los ejes las nuevas variables (columnas) creadas por el programa, tal como se indica en la figura de la pgina siguiente.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

16

Aqu se introduce la variable que lleva los nombre asignado a las UBC Tras presionar el botn Aceptar en la pantalla de la figura anterior, la pgina de resultados es la siguiente.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

17

Si lo que se pretende es realizar un diagrama bidimensional, dentro del subprograma Dispersin/puntos se elegir Dispersin matricial, y se proceder de forma anloga.

4. ANLISIS DE AGRUPAMIENTOS PARA DATOS MULTI-ESTADO. 4.1. Agrupamiento en base a todos los caracteres analizados cuando estos son de tipo multiestado cualitativo o cuantitativos: Calcular y dibujar el dendrograma (puede ser necesario estandarizar o normalizar variables). En SPSS el Anlisis de Agrupamientos se encuentra dentro del mdulo Clasificar, al que se accede a travs del men desplegable Analizar. Lo normal en caracterizacin de germoplasma es usar el mtodo de conglomerados jerrquicos, que se encuentra en el subprograma Conglomerados jerrquicos (ver figura siguiente).

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

18

UBC

La pantalla que se obtiene se presenta en la siguiente figura. Lo primero es indicar cuales son las variables utilizadas para la conglomeracin, y la variable que va a proporcionar las etiquetas de los casos. Es preciso sealar si se quieren conglomerar casos o variables. Tambin debe sealarse si se desea que la salida del programa muestre los Estadsticos y los Grficos.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

19

UBC

UBC

Presionando el botn de Estadsticos es preciso sealar: Historial de conglomeracin si se desea conocer como se forma el dendrograma Matriz de distancias si se desea que el programa la muestre. En Conglomerado de pertenencia se puede sealar si se quiere que para cada UBC (= caso) el programa le asigne un conglomerado de pertenencia. Si se indica Solucin nica, es preciso sealar el nmero de conglomerados que quieren considerarse. Con la opcin Rango de soluciones el programa realiza una optimizacin. Dado que se trabaja con material biolgico, no parece adecuado que un algoritmo decida por el investigador, Por ello es preferible analizar primero el dendrograma obtenido, y luego volver a realizar el anlisis e indicar ya el nmero de conglomerados que el investigador desee considerar.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

20

Presionando el botn de Grficos es preciso sealar: Dendrograma si se desea que el programa lo muestre.

Presionando el botn de Mtodo es preciso sealar: Mtodo de conglomeracin El mtodo de Ligamiento Promedio en SPSS recibe el nombre de Vinculacin inter-grupos.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

21

En Medida hay que indicar el coeficiente a utilizar para el clculo de la matriz de distancias. Los coeficientes a utilizar en el caso de matrices de datos multi-estado figuran en el apartado Intervalo. Los coeficientes a utilizar en el caso de matrices de datos doble-estado figuran en el apartado Binaria. Transformar valores sirve para realizar la estandarizacin de las variables. Hay diferentes opciones de estandarizacin, la ms habitual es la obtencin de Puntuaciones Z

Presionando el botn de Guardar... es posible que el programa guarde el nmero de conglomerado de pertenencia de cada UBC como una nueva variable (ver discusin de la pgina 16). Esto es til para realizar ulteriores anlisis como por ejemplo un anlisis de varianza para detectar las diferencias entre los valores medios de cada conglomerado para cada carcter.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

22

Una vez realizadas las operaciones anteriores, para ejecutar el anlisis se presionar el botn Aceptar, como se indica en la siguiente figura.

UBC

UBC

En la pantalla de Resultados (pagina siguiente) la informacin que ms nos interesa es la se indica a continaucin: Matriz de distancias. Dendrograma.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

23

El dendrograma puede editarse haciendo doble click sobre el mismo. Para evitar que salga cortado en los casos en los que es muy largo, hay que ralizar algunos cambios en el mdulo Opciones del men desplegable Edicin-

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

24

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

25

4.2. Agrupamiento en base a los primeros componentes principales (los que recogen una mayor variabilidad): Calcular y dibujar el dendrograma. El clculo de la matriz de similitud se har en este caso a partir de la matriz de proyeccin de las UBC sobre el nmero de componentes principales que el investigador quiera considerar, que en este caso harn las veces de caracteres. SPSS denomina a dichas proyecciones Puntuaciones factoriales. Para poder utilizarlas ahora es preciso haberlas guardado en el ACP (apartado 3.1. Pg. 9). El nmero de Componentes Principales a utilizar debe ser definido por el investigador. Por ejemplo el bastante comn utilizar los que presentan eiguen-valores mayores que 1. Los pasos a realizar en el anlisis son los ya descritos en el punto 4.1. (Pags. 14 a 20), pero con las siguientes variaciones: Las variables (=caracteres) sern ahora las puntuaciones factoriales del ACP, que si se solicit al programa que las guardara lo habr hecho bajo el nombre REGRfactorscore#for analysis, haciendo alusin al mtodo utilizado para el clculo de las puntuaciones (REGR) y al nmero de Componente Principal respecto al que se ha realizado la proyeccin (#)

UBC

UBC

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

26

Otra variacin es que en el cuadro de dilogo que aparece al presionar el botn Mtodo en Transformar variables ahora no hay que hacer ningn tipo de transformacin, ya que las nuevas variables no lo precisan.

4.3. Realizar un ANOVA para comprobar si los valores medios de cada cluster para cada carcter son significativamente diferentes. 4.3.1. Creacin de una nueva variable en la Matriz Bsica de Datos con el nmero de conglomerado al que pertenece cada UBC. La primera condicin es que a la hora de realizar el Anlisis de Conglomerados, se haya solicitado, tras presionar el botn Guardar..., la creacin en la Matriz Bsica de Datos de una nueva variable que es el nmero de conglomerado de pertenencia de cada UBC (Pg 18). La figura siguiente resume los pasos a realizar.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

27

UBC

4.3.2. Realizacin del ANOVA tomando como variable dependiente el conglomerado de pertenencia y como variables independientes todos los caracteres analizados. En SPSS el Anlisis de Varianza de un factor encuentra dentro del mdulo Reduccin de datos, al que se accede a travs del men desplegable Analizar, en el subprograma Anlisis factorial.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

28

UBC

La pantalla que se obtiene es la que se presenta a continuacin:

UBC

Esta es la nueva variable que indica el conglomerado de pertenencia

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

29

Presionando el botn de Opciones ... es preciso sealar: En Estadsticos: Descriptivos para obtener los estadsticos descriptivos. Prueba de homogeneidad de la varianza. Si hubiera que rechazar la hiptesis de igualdad de varianzas habra que sealar BrownForsythe para utilizarlo en lugar del valor F cuando las varianzas son desiguales.

Presionando el botn de Post-Hoc es preciso sealar las pruebas post-hoc que se quiere que realice el programa: Asumiendo varianzas iguales la ms aconsejada es la de Tukey. Si no se pudieran asumir varianzas iguales, estara aconsejada la prueba de Games-Howell

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

30

Nota importante: Para que puedan realizarse las pruebas Post-Hoc es necesario que todos y cada uno de los grupos tenga al menos dos casos.

Una vez realizadas las operaciones anteriores, para la realizacin del anlisis se presionar el botn Aceptar, como se indica en la siguiente figura.

UBC

En la pantalla de Resultados (pagina siguiente) la informacin que ms nos interesa es la siguiente: Descriptivos: Incluye los estadsticos descriptivos. Prueba de homogeneidad de varianzas: Resultados de la prueba de Levene para la homogeneidad de varianzas. Si no se rechaza la hiptesis nula entonces las varianzas son homogneas. ANOVA: Es la tabla del ANOVA. Pruebas post-hoc: Presenta el resultado de las pruebas post-hoc. Algunas de las pruebas post-hoc, como por ejemplo Tukey, hacen grupos homogneos, que es lo que se presenta en el subapartado Subconjuntos homogneos.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

31

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

32

5. ANLISIS DE AGRUPAMIENTOS PARA DATOS DOBLE-ESTADO: CALCULAR Y DIBUJAR EL DENDROGRAMA. Los pasos a realizar en el anlisis son los ya descritos en el punto 4.1. (Pags. 14 a 20), pero con las siguientes variaciones:

UBC

UBC

En el cuadro de dilogo que aparece al presionar el botn Mtodo en Medida hay que indicar el coeficiente a utilizar para el clculo de la matriz de distancias. Al tratarse de matrices de datos doble-estado debe utilizarse uno de los coeficientes que figuran en el apartado Binaria.

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

33

Curso Intensivo de Postgrado. UACH. Mxico 2010.

Fernando Gonzlez Andrs.

También podría gustarte