Está en la página 1de 10

Departamento de Economía Aplicada I

ESCUELA UNIVERSITARIA DE ESTUDIOS EMPRESARIALES

DIPLOMATURA EN CIENCIAS EMPRESARIALES

ESTADÍSTICA

Ejercicios Resueltos
ANÁLISIS ESTADÍSTICO DE DOS VARIABLES Y RE-
GRESIÓN LINEAL SIMPLE

Curso 2006-2007
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

1) A partir de una muestra de 100 familias se desea hacer un estudio sobre la relación
entre el ingresos (X) y los ahorro (Y). Los datos obtenidos se recogen en la siguiente
tabla, expresados en miles euros anuales:

Y
0–1 1-5 5–8
X

4-8 30 20 0
8 - 15 3 14 18
15 - 20 0 0 15

a) Obtener las distribuciones marginales.


b) Calcular el ingreso anual medio, el ahorro anual medio y medir la representatividad
de ambos valores medios.
c) ¿Cuál es el valor más frecuente del ahorro para un ingreso comprendido entre 8000
y 15000 euros?
d) Calcular el valor del ingreso anual mínimo de una familia para encontrarse entre el
50% de las familias con mayores ingresos.
e) ¿Cuál sería el grado de relación lineal entre estas dos variables?
f) ¿Son independientes las variables?
g) Si el ahorro puede relacionarse con los ingresos mediante un modelo lineal, estime
dicha función e interprete el significado de cada uno de los coeficientes.
h) ¿Qué porcentaje de variación del ahorro queda explicado por el modelo lineal del
apartado anterior?
i) Utilizando el modelo lineal obtenido anteriormente ¿Cuál será el ahorro estimado
para una familia que tiene unos ingresos anuales de 12000 euros?

SOLUCIÓN:

a) Las frecuencias de la distribución marginal de X las obtenemos sumando las frecuencias


conjuntas de las filas correspondientes a cada uno de los intervalos de la variable X,
mientras que las frecuencias de la distribución marginal de Y las obtenemos sumando las
frecuencias conjuntas de las columnas correspondientes a cada uno de los intervalos de la
variable Y.

Así, la frecuencia marginal del intervalo (4 , 8] de la distribución marginal de X será:

n2 . = 3 + 14 + 18 = 35

y la frecuencia marginal del intervalo (1 , 5] de la distribución marginal de Y será:

n1. = 30 + 3 + 0 = 33

Por tanto, las distribuciones marginales son:

2
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

Y
0-1 1-5 5-8 ni.
X
4-8 30 20 0 50
8 - 15 3 14 18 35
15 - 20 0 0 15 15
n. j 33 34 33 100

b) Tenemos que calcular las medias de las distribuciones marginales de X e Y.

X ni. xi xi ni. xi2. ni. Y n. j yj y j n. j y.2j n. j


4-8 50 6 300 1800 0-1 33 0,5 16,5 8,25
8 - 15 35 11,5 402,5 4628,75 1-5 34 3 102 306
15 - 20 15 17,5 262,5 4593,75 5-8 33 6,5 214,5 1394,25
100 965 11022,5 100 333 1708,5

1 k 965 1 m
333
x = ∑ xi ni . = = 9, 65 y= ∑y n j .j = = 3,33
N i =1 100 N j =1 100

Luego, el ingreso anual medio es 9,65 miles de euros y el ahorro anual medio es 3,33
miles de euros.

La representatividad de estos valores medios la medimos mediante el coeficiente de


variación.

1 k 2 11022,5 4,1355
S x2 = ∑
N i =1
xi. ni. − x 2 =
100
− 9, 652 = 17,1025 ⇒ S x = 4,1355 ⇒ CVx =
9, 65
= 0, 4285

m
1 1708,5 2, 4487
S y2 =
N
∑y
j =1
2
.j .jn − y2 =
100
− 3,332 = 5,9961 ⇒ S y = 2, 4487 ⇒ CVy =
3,33
= 0,7353

c) Tenemos que calcular la moda de la distribución de Y condicionada a que x ∈ (8 , 15] .


Dicha distribución condicionada viene dada por:

Y X =11,5
n j x2 a j| x2 d j| x2 { }
max d j|x2 = 6 ⇒ Mo ∈ (5 , 8] ⇒
0-1 3 1 3 6 − 3,5
1-5 14 4 3,5 ⇒ Mo = 5 + ⋅ 3 = 5,8824
(6 − 3,5) + (6 − 0)
5-8 18 3 6
35
d) Tenemos que calcular la mediana de la distribución marginal de X.

3
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

X ni. Ni
4-8 50 50 N 100
8 - 15 35 85 = = 50 ⇒ Me = 8 miles de euros
2 2
15 - 20 15 100
100

e) El grado de relación lineal entre las variables viene dado por el coeficiente de correla-
ción.
S xy
rxy =
Sx S y
Calculemos la covarianza entre las dos variables:

1 k m
S xy = ∑∑ xi y j nij − x ⋅ y =
N i =1 j =1
6 ⋅ 0,5 ⋅ 30 + 6 ⋅ 3 ⋅ 20 + 11,5 ⋅ 0,5 ⋅ 3 + 11,5 ⋅ 3 ⋅14 + 11, 5 ⋅ 6, 5 ⋅ 18 + 17,5 ⋅ 6,5 ⋅15
= − 9, 65 ⋅ 3,33 = 7,8855
100

Así,
S xy 7,8855
rxy = = = 0, 7787
Sx S y 4,1355 ⋅ 2, 4487

f) Las variables no son independientes, ya que si lo fueran tendrían que ser incorreladas, y
rxy ≠ 0 .

g) Tenemos que calcular la recta de regresión de Y sobre X:

S xy 7,8855
b= 2
= = 0, 4611 a = y − bx = 3, 33 − 0, 4611 ⋅ 9, 65 = −1,1196
S x 17,1025

Luego, la recta de regresión de Y sobre X es: y* = −1,1196 + 0, 4611x

h) El porcentaje de variación del ahorro queda explicado por el modelo lineal del apartado
anterior lo obtenemos a partir del coeficiente de determinación:

Rxy2 = rxy2 = 0, 7787 2 = 0, 6064

Así, el porcentaje de variación del ahorro que queda explicado por la recta de regre-
sión es del 60,64%.

i) La predicción del ahorro para una familia con unos ingresos anuales de 12000 euros que
proporciona la recta de regresión sería:

4
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

y* = −1,1196 + 0, 4611⋅12 = 4, 4136 miles de euros

2) La evolución trimestral de los depósitos a la vista y los depósitos a plazo, expresados en


miles de millones de euros, en Andalucía, es la que aparece recogida en la siguiente
tabla:

Año 2003 2004 2005


Trimestre 1º 2º 3º 4º 1º 2º 3º 4º 1º
Depósitos
15,1 16,6 16,8 17,3 18,2 19,6 19,4 19,8 20,6
a la vista
Depósitos
28,9 29,1 28,9 30,3 31,4 32,4 32,7 34,9 36,9
a plazo
Fuente: Banco de España

a) Representar gráficamente la nube de puntos. Cuantifique el grado de relación lineal


entre las variables.
b) Obtener la recta de regresión que explique los depósitos a plazo a partir de los depó-
sitos a la vista. Interprete los coeficientes de dicha recta.
c) ¿Qué porcentaje de variación de los depósitos a plazo queda explicado por los depó-
sitos a la vista?
d) Si para el segundo trimestre del año 2005 se esperan 21,4 miles de millones de euros
en depósitos a la vista, ¿cuál sería la predicción de los depósitos a plazo, utilizando el
modelo lineal calculado?
e) Si los depósitos a la vista se incrementan un 1% a partir del valor del primer trimes-
tre de 2005, ¿en qué porcentaje se incrementan los depósitos a plazo?
f) Determine la recta de regresión que explique los depósitos a la vista a partir de los
depósitos a plazo. ¿Qué porcentaje de variación de los depósitos a la vista explica di-
cha recta?
g) Según el modelo obtenido en el apartado anterior, ¿cuál sería la estimación de los
depósitos a la vista, si los depósitos a plazo fueran 38 mil millones de euros?
h) Representar gráficamente las dos rectas de regresión junto con la nube de puntos.

SOLUCIÓN:

a) Llamemos X: depósitos a la vista en miles de millones de euros, e Y: depósitos a plazo en


miles de millones de euros.

La nube de puntos, o diagrama de dispersión, la obtendremos representando los pun-


tos ( xi , yi ) :

5
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

36,9

34,9

32,4

31,4

30,3

28,9

15,1 16,6 17,3 18,2 19,4 20,6


Para cuantificar el grado de relación lineal entre las variables, calculamos el coefi-
S
ciente de correlación lineal: rxy = xy
Sx S y

xi yi xi2 yi2 xi yi
15,1 28,9 228,01 835,21 436,39
16,6 29,1 275,56 846,81 483,06
16,8 28,9 282,24 835,21 485,52
17,3 30,3 299,29 918,09 524,19
18,2 31,4 331,24 985,96 571,48
19,6 32,4 384,16 1049,76 635,04
19,4 32,7 376,36 1069,29 634,38
19,8 34,9 392,04 1218,01 691,02
20,6 36,9 424,36 1361,61 760,14
163,4 285,5 2993,26 9119,95 5221,22

1 N 163, 4 1 N 2 2993, 26
x= ∑
N i =1
xi =
9
= 18,1556 S x2 = ∑
N i =1
xi − x 2 =
9
− 18,1556 2 = 2, 9586
N
1 285, 5 1 N 2 9119,95
y=
N
∑ yi =
i =1 9
= 31, 7222 S y2 = ∑
N i =1
yi − y 2 =
9
− 31, 72222 = 7, 0298

1 N 5221, 22

S xy =
N i =1
xi yi − x ⋅ y =
9
− 18,1556 ⋅ 31, 7222 = 4, 2

Por tanto, el coeficiente de correlación vale:

6
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

4, 2
rxy = = 0,9209
2,9586 7, 0298

lo que indica que existe el grado de relación lineal entre las variables es alto, y, por ser
positivo, que al aumentar el depósito a la vista también aumenta el depósito a plazo, y vi-
ceversa.

b) Tenemos que determinar la recta de regresión de Y sobre X: y* = a + bx


S 4, 2
b = xy2 = = 1, 4196
S x 2,9586

a = y − bx = 31, 7222 − 1, 4196 ⋅18,1556 = 5,9485

Luego, la recta de regresión que explica los depósitos a plazo a partir de los depósitos
a la vista es: y* = 5,9485 + 1, 4196 x .

El coeficiente b = 1, 4196 indica que por cada unidad que aumentan los depósitos a la
vista, los depósitos a plazo aumentan 1,4196 unidades, es decir, por cada 1.000.000.000
de euros de aumento en los depósitos a la vista, los depósitos a plazo aumentan
1.419.600.000 euros.

El coeficiente a = 5,9485 indica que si los depósitos a la vista valen cero, el valor de
los depósitos a plazo sería 5.948.500.000 euros.

c) El porcentaje de variación de los depósitos a plazo que queda explicado por los depósitos
a la vista nos lo proporciona el coeficiente de determinación:

Rxy2 = rxy2 = 0,9209 2 = 0,8481

Por tanto, el 84,81% de las variaciones de los depósitos a plazo están explicados por
los depósitos a la vista.

d) Para obtener la predicción de los depósitos a plazo para un valor de los depósitos a la vis-
ta de 21,4 miles de millones de euros, sustituimos este valor en la ecuación de la recta de
regresión:

y* = 5,9485 + 1, 4196 ⋅ 21, 4 = 36,3279 miles de millones de euros

e) El porcentaje de incremento de los depósitos a plazo para un incremento del 1% a partir


del valor del primer trimestre de 2005 nos lo proporciona la elasticidad en el punto
x0 = 20, 6 :
bx0 1, 4196 ⋅ 20, 6
E y|x = x0 = ⇒ E y|x =20,6 = = 0,831
a + bx0 5,9485 + 1, 4196 ⋅ 20, 6
Por tanto, si los depósitos a la vista se incrementan un 1% a partir del valor 20,6, los
depósitos a plazo se incrementan un 0,831%.

7
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

f) Tenemos que calcular la recta de regresión de X sobre Y: x* = a '+ b ' y

S xy 4, 2
b' = 2
= = 0,5975
S y 7, 0298

a ' = x − b ' y = 18,1556 − 0,5975 ⋅ 31, 7222 = −0, 7984

Luego, la recta de regresión que explica los depósitos a la vista a partir de los depósi-
tos a plazo es: x* = −0,7984 + 0,5975 y . El porcentaje de variación de los depósitos a la
vista explicado por los depósitos a plazo es el 84,81%, ya que el coeficiente de determi-
nación es el mismo para las dos rectas de regresión.

Como puede comprobarse, se verifica que b ⋅ b ' = Rxy2

g) Utilizando el modelo obtenido en el apartado anterior, la estimación de los depósitos a la


vista para unos depósitos a plazo de 38 mil millones de euros sería:

x* = −0,7984 + 0,5975 ⋅ 38 = 21,9066 miles de millones de euros

h) La representación gráfica de la nube de puntos y las dos rectas de regresión es:

x* = −0,7984 + 0,5975 y
36,9 y* = 5,9485 + 1, 4196 x

34,9

32,7 (x, y)
31,4
30,3
28,9

15,1 16,6 17,3 18,2 19,4 20,6

Observemos que las dos rectas de regresión se cortan en le punto ( x , y ) y que, por ser
el valor absoluto del coeficiente de correlación próximo a 1, el ángulo que forman las dos
rectas es pequeño.

3) Cierta empresa ha analizado estadísticamente la relación existente entre dos de las


magnitudes que más le preocupan: los costes totales (Y) y los costes variables (X) todos ellos
8
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

a corto plazo. Analizados los datos se comprueba que:

§ Si se construyeran las rectas de regresión de Y sobre X y de X sobre Y ambas rectas


se cortarían en el punto de coordenadas (6 , 4)
§ Si para un coste variable de 12 unidades monetarias se incrementa el mismo en un
1%, el incremento que experimentarían los costes totales, bajo el modelo lineal de
Y sobre X, sería del 0,8%
§ Si se incrementan en una unidad monetaria los costes totales, los costes variables
aumentarían 1,8225 unidades monetarias bajo el modelo lineal de X sobre Y.

Bajo estos supuestos se pide hallar la recta de regresión de Y sobre X y de X sobre Y, y


medir las bondades de ambos ajustes.

SOLUCIÓN:

Tenemos que calcular las dos rectas de regresión: y* = a + bx y x* = a '+ b ' y .

Como las rectas de regresión se cortan en el punto (6 , 4) ⇒ x =6 y=4

Si x = 12 se incrementa en un 1%, Y se incrementa en un 0,8% ⇒ E y| x=12 = 0,8 :

bx0 12b
E y|x = x0 = ⇒ 0,8 =
a + bx0 a + 12b

Si Y aumenta una unidad, X aumenta 1,8225 unidades ⇒ b ' = 1,8225

Como la recta de regresión de Y sobre X pasa por el punto ( x , y ) : 4 = a + 6b . Así, el sis-


tema de ecuaciones:
12b 
0,8 = 
a + 12b 
4 = a + 6b 

proporciona los valores de a y b. Resolviendo este sistema de ecuaciones, obtenemos que:

a = 1,3336 b = 0, 4444 ⇒ y* = 1, 3336 + 0, 4444 x

Como la recta de regresión de X sobre Y pasa por el punto ( x , y ) : 6 = a '+ 4b ' , y como
b ' = 1,8225 , se tiene que: a ' = 6 − 4 ⋅1,8225 = −1, 29 . Por tanto,

x* = −1, 29 + 1,8225 y

La bondad de ajuste de ambas rectas de regresión es la misma, y viene dada por el coefi-
ciente de determinación.

9
Escuela Universitaria de Estudios Empresariales
Departamento de Economía Aplicada I
Ejercicios Resueltos: ANÁLISIS ESTADÍSTICO DE DOS VARIABLES
Curso 2006 - 2007

Rxy2 = b ⋅ b ' = 0, 4444 ⋅1,8225 = 0,8099

Por tanto, el 80,99% de la varianza de una de las variables está explicada por un función
lineal de la otra.

10

También podría gustarte