Explora Libros electrónicos
Categorías
Explora Audiolibros
Categorías
Explora Revistas
Categorías
Explora Documentos
Categorías
PRÁCTICA 4 DE LA ASIGNATURA
“ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES”
1. Una vez recopilada la información sobre los pasajeros del Titanic se tiene un conjunto de
variables y datos con los tripulantes del famoso barco siniestrado. Se ha conseguido reunir
información para las siguientes variables: pclass (clase en la que se viajaba), survived
(sobrevivió o falleció), name (nombre), sex (sexo), age (edad), sibsp (nº esposas o
hermanos acompañantes), parch (nº hijos o padres acompañantes), ticket fare (tarifa),
cabin (cabina en la que viajaba), embarked (dónde embarcó), boat (barco de salvamento).
¿Cuáles de ellas son cualitativas?
-1-
Facultad de Ciencias Políticas y Sociologia
Departamento de Sociología: Metodología y Teoría
Campus de Somosaguas. 28223 Pozuelo de Alarcón (Madrid)
Teléfono: 91-394 2671
3. Utilizando la tabla que aparece a continuación, aplica tus conocimientos sobre tablas de
contingencia para analizar una posible asociación entre el hecho de sobrevivir al accidente
y el sexo del pasajero. Calcula los porcentajes, sus diferencias e interprétalas. ¿Se puede
decir que existe alguna relación entre el hecho de ser hombre o mujer y sobrevivir a ese
desastre?
Ta bla de continge nci a So bre vivió o n o * Sex o d el p asa
Recuento
Sexo del pasaj ero
fem ale male Total
Sobrevivió No 127 682 809
o no Si 339 161 500
Total 466 843 1309
4. Calcula las frecuencias esperadas que se darían en el caso de independencia entre las dos
variables.
5. Calcula χ2. ¿Cuántos grados de libertad tiene la tabla? ¿Qué valor tiene el χ2 teórico? ¿Qué
podemos decir sobre la relación con un nivel de confianza del 95%?
Para 1 grado de libertad y un nivel de confianza del 0,95, el χ2 teórico adopta un valor
de 3,84.
-2-
Facultad de Ciencias Políticas y Sociologia
Departamento de Sociología: Metodología y Teoría
Campus de Somosaguas. 28223 Pozuelo de Alarcón (Madrid)
Teléfono: 91-394 2671
Por tanto, puede concluirse que existe una asociación estadísticamente significativa
entre la variable sexo y la variable supervivencia.
6. En la tabla siguiente aparece la variable “Edad” de los pasajeros del Titanic, recodificada
en cuatro grupos, que se cruza con la variable supervivencia (0=no, 1=sí).
Frecuencias esperadas:
8. Calcular los porcentajes de columna para determinar si hubo algún tipo de relación entre
dichas variables.
Porcentajes de columna:
Si comparamos los porcentajes de columna para los que no sobrevivieron, vemos que
mayoritariamente murieron los ancianos, seguidos de los adultos y los jóvenes, y que los
niños presentaron una tasa de no supervivencia baja (podrían haberse comparado
también los que sí sobrevivieron).
Por tanto, puede pensarse que existe asociación estadísticamente significativa entre las
variables edad y supervivencia.
-3-
Facultad de Ciencias Políticas y Sociologia
Departamento de Sociología: Metodología y Teoría
Campus de Somosaguas. 28223 Pozuelo de Alarcón (Madrid)
Teléfono: 91-394 2671
9. La χ2 de la tabla anterior es 23,66 ¿Existe asociación entre dichas variables? ¿Cómo lo has
resuelto?
Para 3 grados de libertad y un nivel de confianza del 0,95, el χ2 teórico adopta un valor
de 7,72.
χ2 > χ2 teórico 23,66 > 7,72 Se rechaza la hipótesis nula de no asociación (H0)
y se acepta la hipótesis alternativa (H1)
Por tanto, puede concluirse que existe una asociación estadísticamente significativa entre
la variable edad recodificada y la variable supervivencia.
10. Entre las siguientes variables que se cruzan se ha calculado la V de Cramer y el coeficiente
Lambda (ambos significativos), obteniendo los resultados que se detallan. Interprétalos:
11. Somos expertos en relaciones laborales y estamos haciendo un estudio sobre las
empresas de nuestro municipio. Queremos determinar cuáles son los factores que más
influyen en el salario que se percibe en las empresas de nuestra zona geográfica para
identificar posibles discriminaciones salariales. Se ha obtenido la siguiente matriz de
correlaciones.
Indica cuáles son las correlaciones más significativas que se han encontrado. ¿Cómo las
explicarías en una frase (cada una de ellas)?
Si nos fijamos en los datos que quedan por debajo de la línea diagonal verde, observamos
que las correlaciones significativas más altas son las que aparecen marcadas con un
círculo verde:
-4-
Facultad de Ciencias Políticas y Sociologia
Departamento de Sociología: Metodología y Teoría
Campus de Somosaguas. 28223 Pozuelo de Alarcón (Madrid)
Teléfono: 91-394 2671
12. Los siguientes gráficos de dispersión reflejan la relación entre un par de variables de la
tabla. Basándote en los coeficientes obtenidos en la matriz, etiqueta en cada gráfico el
par de variables que crees que se han representado.
Gráfico 1 Gráfico 2
-5-
Facultad de Ciencias Políticas y Sociologia
Departamento de Sociología: Metodología y Teoría
Campus de Somosaguas. 28223 Pozuelo de Alarcón (Madrid)
Teléfono: 91-394 2671
13. Utilizando los datos del Barómetro del CIS de octubre de 2020, se ha llevado a cabo un
análisis de regresión lineal simple (Variable dependiente: Grado de convianza en el
Presidente del Gobierno; Variable independiente: Escala de autoubicación ideológica).
El modelo de regresión lineal simple obtenido presenta una R2 de 0.07, por lo que se
puede afirmar que la variable autoubicación ideológica explica sólo el 7% de la varianza
de la variable dependiente (el grado de confianza en el presidente del Gobierno
Central).
A pesar de explicar un % bajo de la varianza, el modelo es significativo, dado que el
coeficiente F presenta una significatividad de 0,00, que es < que el nivel de significación
teórico del 0,05 (y también del 0,01). Por eso, puede afirmarse que el modelo es
significativo, al 95% y 99% de nivel de confianza.
La ecuación de regresión resultante sería: Y = 3,01 + 0,01 X + e
-6-