Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis de La Relación de Variables25
Analisis de La Relación de Variables25
EJERCICIO 1
Se pretende estudiar la relación del peso según el tipo de residencia. Para ello se hará la
comparación del peso en kg según la zona de residencia con resúmenes numéricos y con
diagramas de cajas. ¿Hay relación entre las variables?
188
100
225
95 46 7
151
90
232
631 14 74 125
5 6
peso_kg
80
70
60
50
ca m p o c iu d a d s u b u rb io o tr o s
R e s id e n c ia
-Respecto a la relación entre las variables, se puede decir que las únicas diferencias significativas,
puesto que el cuarto grupo correspondería a un sector con residencia no definida, se dan al
comparar la población que vive en los suburbios frente al resto. Exceptuando ciertos datos extremos
que pueden llevarnos al error, observamos que tanto la media como en la gráfica de cajas, la
población que vive en los suburbios tiene un peso algo menor que el resto.
EJERCICIO 2
Se pretende estudiar la relación del peso según el nivel de talla_1. ¿Hay relación entre las
variables?
A la vista de los datos presentes podemos decir que el peso varía considerablemente entre las
distintas tallas, tanto en las medias como en los diferentes percentiles (salvo en los datos extremos
de la población de talla media).
ESTADO
Residencia Casado Soltero
campo 5 58
ciudad 27 185
suburbio 16 101
otros 2 6
mosaicplot(~galton$ESTADO+galton$Residencia)
NULL
Casado S o lt e r o
cam po
g a lto n $ R e s id e n c ia
c iu d a d
s u b u r b io
o tr o s
g a lt o n $ E S T A D O
2. Vuelve a hacer la tabla mostrando la distribución de la variable residencia para cada nivel
del estado civil y saca conclusiones.
ESTADO
Residencia Casado Soltero
campo 5 58
ciudad 27 185
suburbio 16 101
otros 2 6
mosaicplot(~galton$Residencia+galton$ESTADO)
N U L L
c a m p o c iu d a d s u b u r b io o tr o s
C asado
g a lto n $ E S T A D O
S o lt e r o
g a lt o n $ R e s i d e n c i a
Según las tablas de contingencia y a la vista de los diagramas de mosaicos se puede decir que la
relación entre las variables de estado civil y de residencia es prácticamente nula, puesto que como
se ve en los mosaicos, los porcentajes de casados y de solteros apenas difieren según la residencia.
4.Repite un estudio parecido para ver la distribución de frecuencias del nivel de peso_1 en
cada modalidad del Nivel de talla_1. Saca conclusiones respecto a la relación de las varibles.
Ahora vamos a realizar un estudio similar al anterior, teniendo en cuenta las variables
cualitativas de nivel de peso (niv_peso1) y nivel de talla (niv_Talla):
Tabla de contingencia:
-niv_Talla
niv_peso1 Baja Media Alta
ligero 11 88 1
medio 3 97 4
pesado 0 74 23
muy pesado 0 65 34
NULL
M e d ia
A lt a
g a lt o n $ n i v _ p e s o 1
Tras observar tanto los datos obtenidos en la tabla como la representación de los mismos en el
diagrama de mosaicos, vemos que, al contrario que en el anterior ejemplo la relación entre los
distintos niveles de peso y de talla si tienen una relación bastante evidente: aunque la mayoría se
concentran en la talla media, en los niveles de pesado y muy pesado vemos que la cantidad de
individuos de talla alta aumentan y de peso medio y bajo son casi inexistentes. Por el contrario, en
los niveles de peso medio o ligero , la cantidad de individuos con talla baja aumentan mientras que
los de talla alta van disminuyendo.
Ejercicio 3:
Con los datos de Empleados trata de encontrar ejemplos que tengan sentido para la relación
entre variables cuantitativas y cualitativas y para la relación entre dos cualitativas:
Con los datos del conjunto de datos Empleados, hemos hecho un análisis de la relación entre varías
variables cualitativas y cuantitivas.
Por ejemplo:
Hemos comparado, haciendo una tabla para el grupo de mujeres, las variables de etnia y de salario
actual, quedando resumido en la siguiente tabla:
mean sd IQR 0% 25% 50% 75% 100% data:n
minoría_étnica 23062.50 3972.369 5025 16350 20212.5 23775 25237.5 35100 40
no minoría 26706.79 8011.894 7500 15750 21900.0 24450 29400.0 58125 176
fre q u e n c y m in o r ía = m in o r ía _ é tn ic a
50
20
0
s a la r i o
m in o r ía = n o m in o r ía
fre q u e n c y
50
20
0
s a la r i o
Aunque existe una diferencia del número de mujeres en cada grupo, se puede decir que la relación
entre étnia y no minoría respecto al salario en el caso de la mujer existe. Las mujeres pertenecientes
a una minoría étnica tienen una media de salario actual menor que las que no pertenecen a una
minoría. Por otro lado, los percentiles nos indican las distintas distribuciones y podemos observar
que en los diferentes segmentos el salario de las mujeres del grupo perteneciente a una minoría
etnica siempre se encuentra por debajo del grupo de mujeres que no pertenecen a una minoría
étnica.
Por otro lado, no hemos podido analizar las diferentes variables cualitativas puesto que no teníamos
la variable de categoría que pone en el cuadernillo, y no tenía sentido comparar las diferentes
variables de minoría respecto al sexo.