Está en la página 1de 6

ANÁLISIS DE LA RELACIÓN DE VARIABLES

1. Relación de una variable cuantitativa y otra cualitativa:

EJERCICIO 1

Se pretende estudiar la relación del peso según el tipo de residencia. Para ello se hará la
comparación del peso en kg según la zona de residencia con resúmenes numéricos y con
diagramas de cajas. ¿Hay relación entre las variables?

-Resumen numérico del peso en kg según zona de residencia:


mean sd IQR 0% 25% 50% 75% 100% data:n
campo 66.18143 7.450232 7.2050 53.69 62.1400 64.700 69.3450 84.78 63
ciudad 65.30132 7.357111 8.9425 49.71 60.6650 64.585 69.6075 92.96 212
suburbio 64.91889 8.650524 9.0800 48.69 59.4700 63.900 68.5500 107.14 117
otros 69.10625 5.597857 7.2050 59.47 65.4325 70.370 72.6375 76.84 8

-Diagrama de cajas para el peso en kg según zona de residencia:

188
100

225
95 46 7
151
90

232

631 14 74 125
5 6
peso_kg

80
70
60
50

ca m p o c iu d a d s u b u rb io o tr o s

R e s id e n c ia
-Respecto a la relación entre las variables, se puede decir que las únicas diferencias significativas,
puesto que el cuarto grupo correspondería a un sector con residencia no definida, se dan al
comparar la población que vive en los suburbios frente al resto. Exceptuando ciertos datos extremos
que pueden llevarnos al error, observamos que tanto la media como en la gráfica de cajas, la
población que vive en los suburbios tiene un peso algo menor que el resto.

EJERCICIO 2

Se pretende estudiar la relación del peso según el nivel de talla_1. ¿Hay relación entre las
variables?

-Peso según el nivel de talla_1. Resumen numérico del mismo:


mean sd IQR 0% 25% 50% 75% 100% data:n
Baja 56.04429 4.123426 6.21 49.71 53.2625 54.930 59.4725 62.65 14
Media 64.46148 7.001193 7.95 48.69 59.8100 63.955 67.7600 107.14 324
Alta 72.44403 7.353976 9.08 58.91 67.2500 70.315 76.3300 92.39 62

A la vista de los datos presentes podemos decir que el peso varía considerablemente entre las
distintas tallas, tanto en las medias como en los diferentes percentiles (salvo en los datos extremos
de la población de talla media).

2-Relación entre dos variables cualitativas


1. Haz una tabla de contingencia de frecuencias absolutas.

Tabla de contingencia de fecuencias absolutas entre el estado civil y la residencia:

ESTADO
Residencia Casado Soltero
campo 5 58
ciudad 27 185
suburbio 16 101
otros 2 6

Datos de la tabla representados en un un diagrama de mosiaco mediante la orden:

mosaicplot(~galton$ESTADO+galton$Residencia)
NULL

Casado S o lt e r o
cam po
g a lto n $ R e s id e n c ia

c iu d a d
s u b u r b io
o tr o s

g a lt o n $ E S T A D O

2. Vuelve a hacer la tabla mostrando la distribución de la variable residencia para cada nivel
del estado civil y saca conclusiones.

Tabla de contingencia con la variable residencia según estado civil:

ESTADO
Residencia Casado Soltero
campo 5 58
ciudad 27 185
suburbio 16 101
otros 2 6

3. Representa en un diagrama de mosaico el apartado anterior:

Diagrama de mosaico de los datos de la tabla mediante la orden:

mosaicplot(~galton$Residencia+galton$ESTADO)
N U L L

c a m p o c iu d a d s u b u r b io o tr o s

C asado
g a lto n $ E S T A D O

S o lt e r o

g a lt o n $ R e s i d e n c i a

Según las tablas de contingencia y a la vista de los diagramas de mosaicos se puede decir que la
relación entre las variables de estado civil y de residencia es prácticamente nula, puesto que como
se ve en los mosaicos, los porcentajes de casados y de solteros apenas difieren según la residencia.

4.Repite un estudio parecido para ver la distribución de frecuencias del nivel de peso_1 en
cada modalidad del Nivel de talla_1. Saca conclusiones respecto a la relación de las varibles.

 Ahora vamos a realizar un estudio similar al anterior, teniendo en cuenta las variables
cualitativas de nivel de peso (niv_peso1) y nivel de talla (niv_Talla):

Tabla de contingencia:

-niv_Talla
niv_peso1 Baja Media Alta
ligero 11 88 1
medio 3 97 4
pesado 0 74 23
muy pesado 0 65 34
NULL

lig e r o m e d io pesado muy pesado


B a ja
g a l to n $ n iv _ T a ll a

M e d ia
A lt a

g a lt o n $ n i v _ p e s o 1

Tras observar tanto los datos obtenidos en la tabla como la representación de los mismos en el
diagrama de mosaicos, vemos que, al contrario que en el anterior ejemplo la relación entre los
distintos niveles de peso y de talla si tienen una relación bastante evidente: aunque la mayoría se
concentran en la talla media, en los niveles de pesado y muy pesado vemos que la cantidad de
individuos de talla alta aumentan y de peso medio y bajo son casi inexistentes. Por el contrario, en
los niveles de peso medio o ligero , la cantidad de individuos con talla baja aumentan mientras que
los de talla alta van disminuyendo.

Ejercicio 3:
Con los datos de Empleados trata de encontrar ejemplos que tengan sentido para la relación
entre variables cuantitativas y cualitativas y para la relación entre dos cualitativas:

Con los datos del conjunto de datos Empleados, hemos hecho un análisis de la relación entre varías
variables cualitativas y cuantitivas.
Por ejemplo:

Hemos comparado, haciendo una tabla para el grupo de mujeres, las variables de etnia y de salario
actual, quedando resumido en la siguiente tabla:
mean sd IQR 0% 25% 50% 75% 100% data:n
minoría_étnica 23062.50 3972.369 5025 16350 20212.5 23775 25237.5 35100 40
no minoría 26706.79 8011.894 7500 15750 21900.0 24450 29400.0 58125 176
fre q u e n c y m in o r ía = m in o r ía _ é tn ic a

50
20
0

20000 30000 40000 50000 60000

s a la r i o

m in o r ía = n o m in o r ía
fre q u e n c y

50
20
0

20000 30000 40000 50000 60000

s a la r i o

Aunque existe una diferencia del número de mujeres en cada grupo, se puede decir que la relación
entre étnia y no minoría respecto al salario en el caso de la mujer existe. Las mujeres pertenecientes
a una minoría étnica tienen una media de salario actual menor que las que no pertenecen a una
minoría. Por otro lado, los percentiles nos indican las distintas distribuciones y podemos observar
que en los diferentes segmentos el salario de las mujeres del grupo perteneciente a una minoría
etnica siempre se encuentra por debajo del grupo de mujeres que no pertenecen a una minoría
étnica.

Por otro lado, no hemos podido analizar las diferentes variables cualitativas puesto que no teníamos
la variable de categoría que pone en el cuadernillo, y no tenía sentido comparar las diferentes
variables de minoría respecto al sexo.

También podría gustarte