Está en la página 1de 11

EC212 – Computación I

Guía de usuario IBM SPSS 21

Laboratorio 11. Uso de software SPSS21


Análisis de DISPERSION
En esta sesión vamos a utilizar las principales opciones para el Análisis de
Regresión.

El archivo de datos a utilizar es Banco.sav

1.1 Cómo dibujar nubes de puntos


Atendiendo a las etapas que hay que realizar en cualquier estudio de la regresión
entre dos variables, comenzamos presentando el análisis gráfico. El objetivo es
representar mediante nubes de puntos las variables en estudio. Recordemos que
esta representación sugerirá la posible función a utilizar en el análisis de
regresión.
Para ello, debemos seguir la secuencia:
Gráficos >> Cuadros de diálogo antiguos >> Dispersión/Puntos …

Aparecerá el siguiente cuadro de diálogo:

Opción Dispersión simple: Seleccionando esta opción podremos representar la


nube de puntos para un par de variables, distinguiendo (si queremos) los puntos
según los valores de una tercera variable. Presionamos [Definir] y se presenta un

ASC_UNI / Pag. 1
EC212 – Computación I
Guía de usuario IBM SPSS 21

nuevo cuadro de diálogo:

En este cuadro debemos especificar dos variables: una correspondiente al eje


vertical (en el recuadro EJE Y) y otra al eje horizontal (en el recuadro EJE X).
Colocaremos en el eje Y la variable endógena o explicada (dependiente) y en el eje
X la variable exógena o explicativa (independiente).
En el recuadro ESTABLECER MARCAS POR se puede especificar una variable de
forma que cada punto de la nube se represente de forma distinta según las
categorías que adopte la variable indicada. En el recuadro ETIQUETAR LOS
CASOS MEDIANTE se puede seleccionar otra variable para añadir a cada punto
del gráfico el valor que le corresponde en la variable indicada. Esta última opción
no se ejecuta a no ser que se edite el gráfico, como veremos más adelante.

Ejercicio 1.1: Obtenga la nube de puntos para las variables SALACT y SALINI
diferenciando según los valores de la variable SEXO.
1. Abra el fichero de datos BANCO.SAV
2. Seleccione el menú Gráficos >> Cuadros de diálogo antiguos >>
Dispersión/Puntos…
3. En el cuadro de diálogo seleccione Regresión simple y presione DEFINIR..
4. Seleccione la variable SALACT y pásela al EJE Y y la variable SALINI al EJE X.
5. Seleccione la variable SEXO y ubíquela en el recuadro ESTABLECER MARCAS
POR.
6. Presione [Aceptar]. Aparecerá la siguiente nube de puntos:

ASC_UNI / Pag. 2
EC212 – Computación I
Guía de usuario IBM SPSS 21

Interpretación: Parece existir una relación lineal entre el salario que cobran
actualmente los empleados de este banco y su salario inicial tanto en los hombres
como en las mujeres.

Opción Dispersión superpuesto: Con esta opción podremos representar la nube de


puntos de varios pares de variables sobre los mismos ejes. Para que la
representación gráfica no dé lugar a confusión, se recomienda que las variables del
mismo eje estén expresadas en las mismas unidades de medida.

Presionando [Definir] aparece el siguiente cuadro de diálogo:

ASC_UNI / Pag. 3
EC212 – Computación I
Guía de usuario IBM SPSS 21

 Se selecciona un par de variables en el recuadro que contiene la lista. Una vez


seleccionado, éste se muestra en el cuadro SELECCIONES ACTUALES, como se
muestra en la figura anterior. Mediante el botón de la flecha se pasan al cuadro
PARES Y-X. La primera variable seleccionada será la variable X (representada en
el eje horizontal), mientras que la segunda la variable Y (representada en el eje
vertical).
 Se puede cambiar la asignación de las variables a los ejes seleccionando el par y
haciendo clic en el ícono (INTERCAMBIAR PAR).
 En el recuadro ETIQUETAR LOS CASOS MEDIANTE se puede especificar una
variable de forma que se añade a cada punto del gráfico el valor que le corresponde
en la variable indicada.

Ejercicio 1.2: Represente en los mismos ejes la nube de puntos del par de
variables EDAD y SALACT y el par de variables EDAD y SALINI. Puesto que
queremos estudiar los salarios según la edad, se recomienda la variable EDAD en el
eje X y las variables SALACT y SALINI en el eje Y.
1. Seleccione Gráficos >> Cuadros de diálogo antiguos >> Dispersión/Puntos …
2. En el cuadro de diálogo principal seleccione Dispersión superpuesto. Presione
[Definir].
3. En el nuevo cuadro de diálogo seleccione las variables SALACT y EDAD y páselas al
recuadro PARES DE Y-X (si es necesario presione INTERCAMBIAR PAR para
tener a la variable EDAD en el eje X). Seleccione las variables SALINI y EDAD y
llévelas al recuadro PARES DE Y-X (si es necesario presione para tener a la
variable EDAD en el eje X).

ASC_UNI / Pag. 4
EC212 – Computación I
Guía de usuario IBM SPSS 21

4. Presione el botón [Aceptar].

Interpretación: No parece existir relación lineal entre las variables EDAD y


SALACT ni entre EDAD y SALINI. Los valores de SALACT son mayores que los
valores de SALINI para casi todos los individuos. Se observa la existencia de un
dato atípico para la variable SALACT.

Opción Dispersión matricial: Con esta opción se representan en la misma gráfica,


pero en distintos ejes, la nube de puntos de varios pares de variables. Presionamos

ASC_UNI / Pag. 5
EC212 – Computación I
Guía de usuario IBM SPSS 21

[Definir] y se presenta un nuevo cuadro de diálogo

1. En el recuadro VARIABLES EN LA MATRIZ se debe incluir al menos dos variables.


2. En el recuadro ESTABLECER MARCAS POR se puede indicar una variable de
manera que cada punto se represente de forma distinta según las categorías de la
variable indicada.
3. En el recuadro ETIQUETAR LOS CASOS MEDIANTE se puede seleccionar otra
variable para asociar a cada punto el valor que en ella le corresponde.

Ejercicio 1.3: Obtenga las nubes de puntos correspondientes a los diferentes


pares de variables que se puedan formar con las variables SALACT, SALINI,
EXPERIEN y EDAD. Distinga en las nubes de puntos los casos según los valores de
la variable RAZA.
1. Seleccione Gráficos >> Cuadros de diálogo antiguos >> Dispersión/Puntos …
2. En el cuadro de diálogo principal seleccione la opción Dispersión matricial.
3. En el nuevo cuadro de diálogo lleve al recuadro VARIABLES EN LA MATRIZ las
variables SALACT, SALINI, EXPERIEN y EDAD. Lleve la variable RAZA al
recuadro ESTABLECER MARCAS POR.

ASC_UNI / Pag. 6
EC212 – Computación I
Guía de usuario IBM SPSS 21

4. Presione ACEPTAR.

Interpretación: Parece existir relación lineal entre el salario actual y el inicial así
como entre la edad y la experiencia laboral.

ASC_UNI / Pag. 7
EC212 – Computación I
Guía de usuario IBM SPSS 21

1.2 Cómo dibujar funciones polinómicas sobre la nube de


puntos y calcular la bondad del ajuste
Una vez dibujada la nube de puntos es posible representar la Recta de regresión, la
Parábola o la Cúbica que mejor se ajusta y obtener el valor del Coeficiente de
determinación que mide la Bondad del ajuste. Para ello, es necesario editar el
gráfico presionando dos veces sobre el mismo. A continuación se selecciona en el
menú del editor de gráficas la opción Elementos, como se muestra a continuación:

1.2.1 OPCION DISPERSION SIMPLE O MATRICIAL


Ejercicio 1.4: Obtenga la recta de regresión de SALACT sobre SALINI y el
Coeficiente de determinación lineal entre estas dos variables.
1. Edite (haciendo doble clic) la nube de puntos de las variables SALACT y SALINI
que ha obtenido en el ejercicio 2, o bien créela de nuevo.
2. Seleccione Elementos >> Línea de ajuste total del menú del editor de gráficas.
3. En pantalla aparece una figura similar a la siguiente:

ASC_UNI / Pag. 8
EC212 – Computación I
Guía de usuario IBM SPSS 21

4. Elija el Método de ajuste Lineal y presione el botón [Cerrar]. En pantalla aparece


una figura similar a la siguiente:

Interpretación: La relación lineal entre las variables SALACT y SALINI es alta ya


que el coeficiente de determinación es alto (0,775). La recta de regresión de
SALACT sobre SALINI es creciente lo que indica que a mayor salario inicial le
corresponde mayor salario actual.

ASC_UNI / Pag. 9
EC212 – Computación I
Guía de usuario IBM SPSS 21

1.2.2 OPCION DISPERSION SUPERPUESTO


Ejercicio 1.5: Dibuje en la misma gráfica las nubes de puntos de los pares de
variables EDAD y SALACT y EDAD y SALINI con la recta de regresión y la
medida de bondad del ajuste para cada par.
1. Seleccione Gráficos >> Cuadros de diálogo antiguos >> Dispersión/Puntos….
2. Seleccione la opción Dispersión superpuesto. Presione [Definir].
3. Seleccione las variables SALACT y EDAD. Observe que aparecen en el cuadro
SELECCIONES ACTUALES. Pase las variables seleccionadas al cuadro PARES DE
Y-X.
4. Como la variable EDAD hace el papel de variable exógena, presione
INTERCAMBIAR PAR para que aparezca en el eje X y la variable SALACT, que es
la endógena, en el eje Y.
5. Repita los pasos 2 y 3 con el par de variables SALINI y EDAD. Presione [Aceptar].

6. Edite la gráfica creada y seleccione Elementos >> Linea de ajuste total en la barra
del menú principal del editor de gráficas.
7. Seleccione Método de ajuste lineal. Presione el botón [Cerrar].
8. El gráfico se muestra en la siguiente figura, donde aparece representada una recta
sobre cada nube de puntos creada. Los puntos claros representan la nube de
puntos de SALINI sobre EDAD. Los puntos oscuros representan la nube de puntos
de SALACT sobre EDAD.

ASC_UNI / Pag. 10
EC212 – Computación I
Guía de usuario IBM SPSS 21

Interpretación: Las nubes de puntos no sugieren la existencia de relación lineal en


ninguno de los casos. El valor del coeficiente de determinación general de Pearson,
que nos indica la bondad del ajuste, está muy próximo a cero, lo que ratifica esta
afirmación.

Ejercicio 1.6: En el fichero BANCO.SAV.


a) Dibuje la nube de puntos para la edad y la experiencia laboral distinguiendo
según el sexo.
¿Qué variable pondría como endógena y cuál como exógena? ¿Parece existir
relación lineal entre ellas?
b) Dibuje la recta de regresión de la variable experiencia laboral sobre la variable
edad y estudie la Bondad del ajuste distinguiendo según el sexo y para el conjunto
de la población. ¿Se mejora la relación lineal al estudiar las variables según el
sexo?. ¿Sería fiable una predicción de la experiencia laboral según la edad para los
hombres? ¿Y para las mujeres?
c) Haga lo mismo utilizando un ajuste cuadrático. ¿Cuál de los dos ajustes elegiría?

ASC_UNI / Pag. 11

También podría gustarte