Está en la página 1de 15

Universidad Autónoma de Madrid

Facultad de Psicología
Curso 2023-2024

ANÁLISIS DE DATOS EN PSICOLOGÍA II

EJERCICIO PRÁCTICO CON SPSS

NOMBRE y APELLIDOS (con mayúsculas) FIRMA

Vanessa Ruiz Díaz

Fecha de entrega:

La fecha tope de entrega de este cuadernillo es el viernes, 20 de diciembre

Formato de entrega: PDF


DESCRIPCIÓN DEL ARCHIVO PracticaSPSS.sav

El archivo de datos contiene las siguientes variables. Los datos proceden de jóvenes de la Comunidad
de Madrid

Tipo de variable
Apartado Descripción Nombre y/o códigos
1 = Hombre
Sexo
Sexo 2 = Mujer
Edad Edad Variable cuantitativa
1 = De 15 a 19 años
Edad recodificada 2 = De 20 a 24 años
Características edadrec 3 = De 25 a 29 años
Personales 1 = Bajo
Nivel de ingresos 2 = Medio
ingresos 3 = Alto
1 = Primarios
Nivel de estudios 2 = Secundarios
estudios 3 = Universitarios
Bebía hace 2 años beber1
Bebe actualmente beber2
Fumaba hace 2 años fumar1
Hábitos de salud
Fuma actualmente fumar2 Variables dicotómicas
Consumía drogas hace 2 años droga1 1 = Sí
Consume drogas actualmente droga2 2 = No
Perspectivas de futuro dim1
Importancia atribuida Sueldo alto dim2
a determinados Autonomía dim3
aspectos del trabajo Estabilidad dim4 Variables cuantitativas
Trabajo en el lugar de residencia dim5 con códigos de 1 a 10
Escalas de Con la vida en general satis1 Variables cuantitativas
satisfacción Con su vida familiar satis2 con códigos de 1 a 10
1 = PSOE
2 = PP
Voto en elecciones generales 2004 3 = Otros
Actitudes políticas Voto 4 = Abstención
1 = Izquierda
Autoubicación ideológica 2 = Centro
ideología 3 = Derecha

Nota: antes de empezar a responder a las preguntas de este ejercicio práctico es importante
familiarizarse con el archivo de datos. Para ello, puede resultar útil revisar los códigos y etiquetas de
las variables y obtener algunos descriptivos (tablas de frecuencias para las variables categóricas y
medidas de tendencia central y de dispersión para las cuantitativas).
PRÁCTICA DE ANÁLISIS DE DATOS II
PREGUNTAS PARA RESOLVER CON EL SPSS

1. Descriptivos
a. Número de variables contiene el archivo: 21
b. Tamaño muestral: 500
c. La edad del sujeto número 20 es: 15 años aproximadamente (15,43)
d. El sujeto nº 10 ha completado estudios de nivel: secundarios
e. El sexo del sujeto nº 8 es: hombre
f. Porcentaje de hombres y mujeres entrevistados: el 75% son hombres y el 25%
son mujeres.
g. La edad mínima y máxima: la edad mínima son 15 años (15,49) y la máxima 29
(29,95).
h. Porcentaje de sujetos menores de edad: 19,4%
i. Valor de la mediana de la variable edad: 23,67
j. Porcentaje de sujetos tiene 25 años o más: 36,6%
k. Porcentaje de sujetos bebe actualmente: 15%
l. Porcentaje de sujetos fuma actualmente: 21,6%
m. Porcentaje de sujetos bebe y fuma actualmente: 7,0%
n. Porcentaje de sujetos no bebe ni fuma actualmente: 70,4%

2. La variable edad está recogida en el archivo de datos de dos formas diferentes: como
variable cuantitativa (edad) y como variable categorizada (edadrec). A partir de la
variable edad, crear una nueva variable categórica con el nombre de edad2 cuyas 4
categorías tengan aproximadamente el mismo número de casos. Indique las edades
que definen los puntos de corte de los grupos.

a. Edad 1: 19,536
b. Edad 2: 23,671
c. Edad 3: 26,808

3. Defina la media y la varianza de las siguientes variables


a. Perspectiva de futuro:
media = 6,67
varianza= 4,411
b. Sueldo alto:
Media= 8,21
Varianza= 2,841
c. Autonomía:
Media = 5,64
Varianza= 7,770
d. Estabilidad:
Media= 6,80
Varianza= 7,059
e. Trabajar en lugar de residencia:
Media= 4,51
Varianza= 3,457

4. Contrastar la H0 de que la media poblacional de satisfacción personal vale 7.


a. H0: µ = 7

H1: µ ≠ 7
b. Media de la variable satis1: 7,35
c. Mediana de la variable satis1: 7
d. Estadístico de contraste vale y su correspondiente nivel crítico es: T= 4,344 y
su nivel crítico = 0,000017
e. La decisión sobre H0 es: rechazar la H0
f. La conclusión es: la media poblacional para la satisfacción personal
correspondiente a la variable satis1 es distinto a 7, por tanto no concuerdan los
datos con lo que suponía la hipótesis nula.
5. ¿Puede asumirse que la satisfacción con la vida en general sigue una distribución
normal unitaria en la población de jóvenes madrileños?
a. Tipo de prueba de contraste: Kolmogorov-Smirnov
b. H0: la variable satisfacción con la vida en general sigue una distribución normal
unitaria en la población de jóvenes madrileños.
c. H1: la variable satisfacción con la vida en general sigue una distribución normal
unitaria en la población de jóvenes madrileños.
d. Valor estadístico de contraste: 0,125 (conocemos media y desviación)
e. Nivel crítico: 0,000001
f. Decisión: como el nivel crítico es menor que el Error Tipo 1 (alfa), rechazamos
la hipótesis nula, por tanto la variable satisfacción con la vida en general no
sigue una distribución normal unitaria en la población de jóvenes madrileños.

6. Se desea contrastar la hipótesis nula de que los jóvenes madrileños valoran por
igual el sueldo alto (dim2) y la estabilidad en el empleo (dim4):

a. Expectativa de contraste: contrastar la hipótesis de igualdad de medias


b. Prueba de contraste: T para muestras relacionadas.
c. H0: 𝜇sueldo alto = 𝜇estabilidad en el empleo
d. Valor del estadístico de contraste: 10,53
e. Modelo de distribución del estadístico de contraste: se distribuye con 499
grados de libertad (n-1= 500-1)
f. Nivel crítico: p= 0,000000 => rechazamos la H0
g. Determinar el Intervalo de confianza con un nivel de confianza del 0,99: el
Interval de confianza viene definido por los límites inferiores y superiores =
(1,150; 1,678)
h. Decisión: rechazamos la hipótesis nula de que los jóvenes madrileños valoran
por igual el sueldo alto y la estabilidad en el empleo.

7. ¿Quiénes están más satisfechos con su vida familiar (satis2), los hombres o las
mujeres?
a. Prueba estadística puede utilizarse para comparar la satisfacción de hombres y
mujeres: prueba T para muestras independientes.
b. H0: 𝜇satis2 hombres= 𝜇satis2 mujeres
c. ¿Se puede asumir homocedasticidad?: si, ya que el estadístico en la prueba de
Levene F=0,349, al que le corresponde un nivel crítico de 0,555, no resulta
significativo y por el que se mantiene la H0 de igualdad de varianzas.
d. Valor del estadístico: -0,620 para contrastar la hipótesis de igualdad de varianzas.
e. Distribución del estadístico: se distribuye según t con 498 grados de libertad.

8. Utilizando la variable edadrec como variable independiente, ¿qué puede concluirse


sobre la opinión manifestada por algunos sociólogos de que el grupo de más edad está
más satisfecho con su vida familiar (satis2) que el grupo de menos edad? (asumimos
que el nivel de medida de la variable satis2 es de intervalos)

a. Procedimiento para realizar este contraste: prueba T para muestras


independientes
b. H0: 𝜇satis2 (grupo menos edad 3) ≥ 𝜇satis2 (grupo más edad 1)
c. H1: 𝜇satis2 (grupo menos edad 3) < 𝜇satis2 (grupo más edad 1)
d. Valor del estadístico de contraste para el supuesto de homocedasticidad:
F= 17,193
e. Nivel crítico del estadístico: 0,000043
f. ¿Puede asumirse que las varianzas poblacionales de los dos grupos comparados
son homogéneas en la variable satis2?: No, debido a que el nivel crítico del
estadístico en la prueba de Levene es significativo (menor de 0,05), por tanto
rechazamos la hipótesis nula de homogeneidad de varianzas.
g. El estadístico de contraste
i. Modelo de distribución: T de Student
ii. Valor: -7,628
iii. Nivel crítico: 0,000000
h. Grupo de jóvenes que se muestra más satisfecho: como hemos rechazado la
hipótesis nula, es el grupo 1 el que se muestra más satisfecho.

9. Consideremos ahora las variables edad y voto

a. Número de votantes de PP: 95


b. Edad media de los votantes del PP: 24,6218
c. Desviación típica de los votantes del PP: 3,50550
d. Se desea contrastar la hipótesis nula de que la edad media de los votantes del
PP es la misma que la edad media de los votantes del PSOE. El planteamiento
de esta hipótesis generaría un tipo de contraste: bilateral
e. H1: µedad votantes del PP ≠ µedad votantes del PSOE
f. La probabilidad asociada al valor 0,02 recibe el nombre de: nivel crítico
g. Decisión sobre la hipótesis nula: tomando el estadístico de contraste un valor
de 0,02, y un nivel crítico de 0,984, siendo el estadístico menor, tanto
mantenemos la hipótesis nula.
h. Conclusión: Al mantener la hipótesis nula, concluimos que las edades medias
de los votantes del PP y del PSOE son iguales.
i. Prueba estadística que debemos utilizar para comprobar que la edad se
distribuye normalmente entre los jóvenes madrileños: para comprobar la
normalidad recurrimos a Kolmogorov-Smirnov
j. Razón por la que se puede o no asumir normalidad en la distribución: no
podemos asumir normalidad ya que el nivel crítico (=0,000), no es mayor al
error tipo I (alfa), por tanto rechazamos la hipótesis nula de normalidad en las
dos variables analizadas (edad y voto).
10. El coeficiente de correlación de Pearson…

a. Entre satis1 y satis2: 0,303


b. Valor del nivel crítico: 0,000

c. Con este nivel crítico, ¿qué decisión debe tomarse sobre H0: rechazaremos

siempre la hipótesis nula.


d. Conclusión: concluiremos que las variables satis1 y satis2 no son
independientes, ya que hemos rechazado la hipótesis nula.

11. Calcula la matriz de correlaciones entre las 5 dimensiones referidas a la importancia


atribuida a aspectos del trabajo (dim1, dim2, dim3, dim4 y dim5).

a. La correlación más alta se da entre las variables (Valor): 0,406 (corresponde a


las variables dim1 y dim2)
b. La correlación más baja se da entre las variables (Valor): 0,027 (corresponde a
las variables dim5 y dim1)
c. Utilizando α=0,01, se puede rechazar la hipótesis de independencia entre
perspectivas de futuro y: sueldo alto y autonomía, ya que en ambas variables su
nivel crítico toma el valor de 0,000.
d. Sin embargo, utilizando α=0,05 no se puede rechazar la hipótesis de
independencia entre trabajar en el lugar de residencia y: perspectivas de futuro
(su nivel crítico toma un valor de 0,545), siendo este mayor que alfa (0,05).

12. Según los últimos datos del Ministerio de Asuntos Sociales, el porcentaje de jóvenes
madrileños que consume algún tipo de droga es del 60%. Con los datos de nuestra
encuesta:

a. Plantear la H0: πdatos Ministerio de Asuntos Sociales = π datos de nuestra encuesta

b. Porcentaje del número de entrevistados que consume algún tipo de droga:


37,8%.
c. El procedimiento SPSS para realizar este contraste es: al tratarse de un
contraste sobre una proporción, tendremos que ir al menú de analizar ->
pruebas no paramétricas -> binomial
d. Nivel crítico: 0,000000 es menor a 0,001
e. Decisión sobre la hipótesis nula: rechazamos la hipótesis nula
f. Conclusión: podemos concluir que rechazamos la hipótesis nula, donde se
asume que el porcentaje de jóvenes madrileños que consumen droga
actualmente es del 60%.
13. Se desea comprobar si han cambiado los hábitos de salud de los jóvenes madrileños
respecto al consumo de tabaco:

a. H1: πfuman actualmente≠ πfumaban hace 2 años


b. Prueba estadística que permite contrastar estas hipótesis: McNemar ya que se
han medido antes y después.
c. El procedimiento SPSS que permite aplicar esa prueba: analizar -> estadísticos
descriptivos-> tablas cruzadas-> estadísticos= McNemar.
d. Nivel crítico: 0,0000000, por tanto es menor a 0,001
e. Conclusión: podemos concluir que rechazamos la hipótesis nula de igualdad de
hábitos respecto al consumo de tabaco en jóvenes madrileños. Por tanto, esos
hábitos han cambiado.
14. Ahora queremos averiguar si el nivel de ingresos (ingresos) está relacionado con el
voto emitido en las elecciones de 2004 (voto).
a. La prueba estadística que debe utilizarse: tendremos que utilizar X2 de Pearson
sobre independencia.
b. H0: el nivel de ingresos y voto emitido no están relacionados y son
independientes. πij= πi+ π+j
c. Modelo de distribución del estadístico: chi-cuadrado (X2) con seis grados de
libertad.
d. Valor del estadístico: 13,924
e. Nivel crítico: 0,030
f. La decisión con α = 0,05: rechazamos la hipótesis nula.
g. Conclusión: el estadístico es significativo por tanto rechazamos la hipótesis
nula de independencia sobre las variables nivel de ingresos y voto, es decir sí
están relacionadas.

15. ¿Puede afirmarse que las conductas de beber (beber2) y fumar (fumar2) están
relacionadas?

a. Prueba estadística que debe utilizarse es X2 de Pearson sobre independencia.


b. H1: las variables beber2 y fumar2, están relacionadas y no son independientes:
πij≠ πi+ π+j
c. Modelo de distribución: chi-cuadrado (X2) con 1 grado de libertad.
d. Valor del estadístico: 32,739
e. Probabilidad asociada al estadístico: 0,000000 es decir menor a 0,001
f. Decisión: rechazamos la hipótesis nula.
g. Conclusión: ambas variables, beber2 y fumar2, están relacionadas, por lo que
no son independientes como se decía en la hipótesis nula, debido a que el
estadístico es significativo.

16. Siguiendo con las conductas de beber (beber2) y fumar (fumar2), ¿puede afirmarse
que la proporción de bebedores difiere de la proporción de fumadores

a. La prueba estadística: McNemar


b. H1: πbeber2 ≠ πfumar2
c. Modelo de distribución: el estadístico de contraste sigue un modelo de
distribución chi-cuadrado (X2) con 1 grado de libertad.
d. Valor del estadístico: 32,739
e. Probabilidad asociada al estadístico: 0,002456
f. Decisión: rechazamos la hipótesis nula.
g. Conclusión: la proporción de bebedores actualmente es distinta a la de
fumadores que hay en la actualidad.

17. Ahora queremos explorar la relación entre la conducta de fumar hace dos años
(fumar1) y beber actualmente (beber2):
a. Obtener una cuantificación del riesgo relativo de beber actualmente entre los
que fumaban y no fumaban hace dos años: 1,971
b. ¿Es ese riesgo significativamente distinto de 1? Si.
c. El resultado obtenido indica: que la proporción de beber actualmente habiendo
sido fumador hace dos años es 1,97 veces mayor que sin haber sido fumador.

18. Completar los datos que faltan en la siguiente tabla. En todos los casos se está
utilizando la variable edadrec como variable independiente o factor

F Sig. η2
Perspectiva futuro 21,655 0,000000 0,080
Sueldo alto 12,389 0,000006 0,047
Autonomía 1,366 0,255967 0,005
Estabilidad 12,728 0,000004 0,049
Trabajar en lugar de residencia 0,251 0,778443 0,001

a. Con α = 0,05, ¿con qué variables no se debe rechazar la hipótesis de igualdad


de medias? Con las variables de autonomía y trabajar en lugar de residencia.
b. Con α = 0,01, ¿con qué variables se debe rechazar la hipótesis de igualdad de
medias? Debemos rechazar la hipótesis nula con las variables de perspectivas
de futuro, sueldo lato y estabilidad.
c. ¿Qué nivel de significación habría que utilizar para rechazar la hipótesis de
igualdad de medias con la variable autonomía? Habría que utilizar un nivel de
significación igual o superior a 0,256.
d. ¿En cuál de las cinco variables son más evidentes las diferencias entre los
grupos de edad? (razona la respuesta). En las variables cuyo tamaño del efecto
es superior al resto, en este caso en la variable perspectiva de futuro podemos
ver que su tamaño del efecto toma un valor de 0,08, esto significa qué una vez
conocido el grupo de edad al que pertenecen se puede conocer la autonomía en
un 8%.

19. Ahora queremos averiguar si el nivel de ingresos (ingresos) está relacionado con las
perspectivas de futuro (dim1):
a. H0 μingresos bajo = μingresos medio = μingresos alto

b. Las medias de dim1 en cada nivel de ingresos son: en el nivel de ingresos bajo,
su media es de 6,57; en el nivel de ingresos medio, su media es de 6,37; y en el
nivel de ingresos alto, su media es de 7,06.
c. Con α = 0,05, ¿se puede asumir homocedasticidad? No podemos asumir
homocedasticidad, debido a que el estadístico de Levene toma un valor de
4,262 y tiene una probabilidad asociada (nivel crítico) de 0,0146.
d. Con α = 0,05, indique su decisión y razone su respuesta. Rechazamos la
hipótesis nula, ya que el estadístico toma un valor de 5,159 y tiene asociada
una probabilidad de 0,006.
e. De acuerdo con los resultados obtenido: podemos concluir que hay diferencias
entre las perspectivas del futuro que tienen los jóvenes, según cual sea su
nivel de ingresos (bajo, medio, alto).

20. Para comparar los promedios de las variables dim1 a dim5

a. ¿Qué prueba debe utilizarse? ANOVA A-MR


b. H0: μdim1 = μdim2 = μdim3 = μdim4 = μdim5
c. Media en las cinco variables: dim1= 6,67; dim2= 8,21; dim3= 5,64; dim4=
6,80; dim5= 4,51.
d. Completa la tabla de ANOVA:
FV gl F p

Intragrupos 3,504 228,08 0,000000

Error 1748,466

e. Decisión: rechazamos la hipótesis nula de igualdad de medidas entre las cinco


dimensiones
f. Conclusión: Hay diferencias en las medias en al menos dos de ellas.

21. Tras utilizar el ANOVA de un factor tomando como variable independiente la edad
recodificada (edadrec) y como variable dependiente la satisfacción en la vida en
general (satis1), se desea utilizar la prueba de Tukey para averiguar entre qué grupos
existen diferencias con un nivel de significación de 0,001

Encontramos diferencias significativas entre el primer grupo (15 a 19 años) y el


segundo (20 a 24 años); así como entre el primer grupo y el tercero (25 a 29
años); y finalmente entre el segundo y el tercer grupo.
Esto es debido a que la probabilidad asociada toma un valor de 0,000000,
siendo este menor que el nivel de significación (0,001), por lo que rechazamos
la hipótesis nula.

22. Para estudiar qué tipo de relación existe entre la edad recodificada (edadrec) y el
nivel de satisfacción general (satis1):
a. Tipo de prueba: ANOVA A-CA
b. Procedimiento SPSS: Analizar- comparar medias- ANOVA de un factor-
contrastes:
FV gl F p
Intergrupo 2 33,898 0,000000
Lineal 1 67,473 0,000000
Cuadrático 1 0,323 0,570
Cúbico - - -
Intragrupo o error 479 - -
Total 481 - -

c. ¿por qué no parece el componente cúbico?


Porque tenemos J= 3 niveles del factor edad recodificada y por tanto solo
podemos contratar la hipótesis de relación lineal o cuadrática.
d. Valor de estadístico de contraste componente lineal: 67,473
e. Decisión sobre el componente cuadrático: mantenemos la hipótesis nula sobre
el componente cuadrático ya que tienen un nivel crítico que vale 0,57.
f. Tipo de relación entre las variables: como hemos rechazado la hipótesis nula
de relación lineal, significa que existe relación lineal significativa.

23. Se desea contrastar la hipótesis de que la media en satis1 es igual para los más
jóvenes que para los otros dos grupos de edad tomados juntos
a. La prueba estadística: ANOVA A-CA, comparaciones a priori (Dunn-
Bonferroni)
b. H0 : (2)μjóvenes =(-1) μmedianos =(-1) μmayores
c. Valor del estadístico: -8,324
d. Modelo de distribución del estadístico: el estadístico sigue un modelo de
distribución t de Student con 479 grados de libertad.
e. Nivel crítico: 0,0000000
f. Decisión: rechazamos la hipótesis nula.
g. Conclusión: la media de la variable satis1 no es igual para los jóvenes que para
los otros dos grupos juntos.
24. Se desea averiguar si la variable dependiente satisfacción familiar (satis2) está
relacionada con los factores sexo (sexo) y edad (edadrec).

a. Efectos que pone a prueba: si hay relación entre la variable satis1 y el sexo, así
como si hay relación entre la variable satis2 y la edad, y si hay alguna
interacción entre los dos factores.
b. La prueba estadística que hay que utilizar es: ANOVA AB-CA.
c. Complete la siguiente tabla
FV gl F p
Sexo*Edad 2 0,859 0,424
Error 494 - -

d. Decisión sobre la interacción (razónela): se mantiene la hipótesis nula de no


interacción, no relación ya que el nivel crítico de los factores toma un valor de
0,424, indicando que no tenemos evidencia suficiente para rechazar la hipótesis
con un nivel de significación de 0,05.
e. Conclusión sobre el factor sexo: el factor sexo no está relacionado con la
variable satis2, ya que tiene una probabilidad asociada de 0,562, por lo que
tampoco podemos rechazar la hipótesis nula de no relación.
f. Conclusión sobre el factor edad: el factor edad sí tiene relación con la variable
satis2, ya que tiene una probabilidad asociada de 0,000000, por lo que podemos
rechazar la hipótesis nula, indicando que si afecta a la satisfacción familiar.

También podría gustarte