Está en la página 1de 27

EJERCICIOSRESUELTOSDEVARIABLEESTADSTICABIDIMENSIONAL

1.Dadalavariableestadsticabidimensional(X,Y)conlatabladefrecuencias

X\Y 1 2 4 6
1 2 0 1 1
3 3 1 0 1
5 0 1 0 5

Sepide:

3 4 3 4
a) nij b) f23 , f34 , f21 c) ni y n j d) f (xi / Y = 2) y f (y j / X = 3)
i =1 j=1 i=1 j =1
e) a10 y a01 f) a11 g) sxy

Solucin:

a)
3 4 3
nij = [ ni1 + ni2 + ni3 + ni4 ] = [ n11 + n12 + n13 + n14 ] + [ n21 + n22 + n23 + n24 ] + [ n31 + n32 + n33 + n34 ] =
i =1 j=1 i=1
= [ 2 + 0 + 1 + 1] + [ 3 + 1 + 0 + 1] + [ 0 + 1 + 0 + 5] = 15

nij
b)Cada nij representalafrecuenciaabsolutadelpar (xi , y j ) ,lafrecuenciarelativasedefine fij = ,
N
3 4
donde N = nij = 15
i =1 j =1

n23 0 n34 5 n21 3


f23 = = =0 f34 = = f21 = =
N 15 N 15 N 15

c)
X\Y 1 2 4 6 ni
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 6
n j 5 2 1 7 15

3 3 4
ni = [n1 + n2 + n3 ] = [4 + 5 + 6] = 15 = nij
i =1 i=1 j=1

4 3 4
n j = [n1 + n2 + n3 + n4 ] = [5 + 2 + 1 + 7] = 15 = nij
j =1 i =1 j = 1
d)

X\Y 1 2 4 6 ni
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 n3 = 6
n j 5 n2 = 2 1 7 15

Lasfrecuenciasrelativascondicionadas f (xi / Y = 2) y f (y j / X = 3) :

n(xi / Y = 2)
X n (xi / Y = 2) f (xi / Y = 2) =
n2
1 0 0
2 1 1/2
3 1 1/2
n2 = 2 1

n (y j / X = 3)
Y n(y j / X = 3) f (y j / X = 3) =
n3
1 0 0
2 1 1/6
4 0 0
6 5 5/6
n3 = 6 1

e)
3 4 3
xi nij xi [ni1 + ni2 + ni3 + n14 ]
a10 = i=1 j=1
= i =1 1
= ( [x1 n11 + x1 n12 + x1 n13 + x1 n14 ] +
N N N
+ [x2 n21 + x2 n22 + x2 n23 + x2 n24 ] + [x 3 n31 + x 3 n32 + x 3 n33 + x 3 n34 ] ) =

=
[1.2 + 1.0 + 1.1 + 1.1] + [3.3 + 3.1 + 3.0 + 3.1] + [5.0 + 5.1 + 5.0 + 5.5] = 49 = 3,26
15 15
3
xi ni 1.4 + 3.5 + 5.6 49
otambin, a10 = i=1 = == = 3,26
N 15 15
4
y j n j
j=1 1.5 + 2.2 + 4.1 + 6.7 55
a01 = = = = 3,6
N 15 15

f)

3 4
x i y j nij
i=1 j=1
a11 = =
N
=
[1.1.2 + 1.2.0 + 1.4.1 + 1.6.1] + [3.1.3 + 3.2.1 + 3.4.0 + 3.6.1] + [5.1.0 + 5.2.1 + 5.4.0 + 5.6.5] = 205 = 13,66
15 15

g) sxy = a11 a10 a01 = 13,66 3,26 . 3,6 = 1,924

2.LascalificacionesobtenidasporungrupodealumnosenEstadstica(E)yMacroeconoma(M):

E 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
M 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7

a)Hallarlatabladefrecuencias
b)Hallarlasdistribucionesmarginales,mediayvarianzadelasmismas
c)Covarianza

Solucin:

a)LavariableE(Estadstica)tomaseisvaloresdiferentes.LavariableM(Macroeconoma)tomasiete
valoresdistintos,porloqueparaformarlatablabastarhacerelrecuentodelasvecesqueserepite
cadapar.

E\M 4 5 6 7 8 9 10 ni
3 1 1 2
4 1 1 2
5 1 4 5
6 1 1
7 1 1 2
8 1 2 2 5
n j 2 4 0 5 1 2 3 17

b)

Ei ni Ei ni E2i ni Mj n j Mj n j M2j n j
3 2 6 18 4 2 8 32
4 2 8 32 5 4 20 100
5 5 25 125 6 0 0 0
6 1 6 36 7 5 35 245
7 2 14 98 8 1 8 64
8 5 40 320 9 2 18 162
17 99 629 10 3 30 300
17 119 903

DistribucinMarginaldeEstadstica:

6 6
Ei ni 99
E2i ni 629
E = a10 = i =1 = = 5,82 a20 = i =1 = = 37 sE2 = a20 a10
2
= 37 5,822 = 3,13
N 17 N 17
DistribucinMarginaldeMacroeconoma:

7 7
Mj n j M2j n j
j=1 119 j =1 903 2
M = a01 = = = 7 a02 = = = 53,11 sM = a02 a201 = 53,11 72 = 4 ,11
N 17 N 17

c)Parahallarlacovarianza: sxy = a11 a10 a01

6 7
Ei Mj nij
i =1 j =1 3.4.1 + 3.5.1 + 4.4.1 + 4.5.1 + 5.5.1 + 5.7.4 + 6.8.1 + 7.7.1 + 7.10.1 + 8.5.1 + 8.9.2 + 8.10.2
a11 = =
N 17

739
a11 = = 43,47 sxy = a11 a10 a01 = 43,47 5,82 . 7 = 2,73
17

3.Dadalatabladecorrelaciones.Hallar n21 paraquelasdosvariablesseanestadsticamente


independientesycalcularsucovarianzaenestecaso.

X\Y 5 7
100 8 4
200 n21 6

Solucin:

X\Y 5 7 ni
100 8 4 12 nij ni n j
n21 n21 + 6 Porserindependientes: = . i, j
200 6 N N N
n j n21 + 8 10 n21 + 18

4 12 10 120 120 72
= 4= 4 [n21 + 18] = 120 n21 = = 12
n21 + 18 n21 + 18 n21 + 18 n21 + 18 4

X\Y 5 7 ni
100 8 4 12
covarianza: sxy = a11 a10 a01
200 12 6 18
n j 20 10 30

2 2
xi ni y j n j
i =1 100 . 12 + 200 . 18 j=1 5. 20 + 7.10
a10 = x = = = 160 a01 = y = = = 5,67
N 30 N 30

2 2
xi y j nij
i=1 j=1 100 . 5. 8 + 100 . 7 . 4 + 200 . 5.12 + 200 . 7 . 6 27200
a11 = = = = 906,67
N 30 30

sxy = a11 a10 a01 = 906,67 160 . 5,67 = 0,53


4.Apartirdelasiguientedistribucinbidimensional (Xi , Yj ; nij ), calcular: x , y , s 2x , s 2y y s xy .Son
independienteslasvariablesXeY?

X\Y 1 2 3
1 0 1 0
0 1 0 1
1 0 1 0

Solucin:

X\Y 1 2 3 ni
1 0 1 0 1 LasvariablesXeYsonindependientes
0 1 0 1 2 n n n
cuandoseverifica ij = i j i, j
1 0 1 0 1 N N N
n j 1 2 1 4

0 2 2 n n n
Nosonindependientesporquenoseverificalarelacin: . 22 2 2
4 4 4 N N N
3 3
xi y j nij
1
a11 = i=1 j=1
= [ 1.2.1 + 1.2.1] = 0
N 4

3 3
xi ni x2i ni
a10 = x = i=1
N
=
1
4
[ 1.1 + 0.2 + 1.1] = 0 a20 = i =1
N
=
1
4
[ ] 2
(1)2 .1 + 0.2 + 12.1 = = 0,5
4

s2x = a20 a10


2
= 0,5 0 = 0,5 a sx = 0,5 = 0,7

3 3
y j n j y2j n j
a01 = y = j=1
N
1
4
[1.1 + 2.2 + 3.1] = 2 a02 = j=1
=
N
=
4
[
1 2
]
1 .1 + 22.2 + 32.1 =
18
4
= 4 ,5
2 2 2
s y = a02 a01 = 4 ,5 2 = 0,5 a s y = 0,5 = 0,7

covarianza sxy = a11 a10 . a01 = 0 0 . 2 = 0

Advirtasequelacovarianzaesceroporlasimetradeladistribucin.

Si (X , Y) independie ntes a s yx = 0
Si s yx = 0 a (X , Y) No independie ntes
5.Sehanobservado,duranteunmesdeterminado,elgastoeneltelfonomvilyelingresototalen
seisfamilias.Losresultadosobtenidos,expresadosenunidadesmonetariascorrientes,hansido:

Gastotelfonomvil Ingresototal(mileseuros)
Familia1 2 4
Familia2 3 6
Familia3 6 8
Familia4 9 10
Familia5 10 12
Familia6 11 20

a)Calcularlacovarianzaentreelgastoyelingreso.Alavistadeesteresultado,puedeafirmarque
lasvariablesseandependienteseindependientes?
b)Paraestas6familiasQuvariablesedistribuyedeformamshomognea,elgastoenmviloen
losingresostotales?

Solucin:

a)

Gastotelfonomvil Ingresototal
yi xi x2i y2i xi . yi

2 4 16 4 8
3 6 36 9 18 Laprimeracolumna( yi ),gastodeltelfonomvil,
6 8 64 36 48 correspondealavariablequeseestudia,dependiendo
9 10 100 81 90 delavariableingresototaldelasfamilias( x i )
10 12 144 100 120
11 20 400 121 220
41 60 760 351 504

6 6
yi
41
y2i 351 s2y = a02 a201 = 58,5 6,832 = 11,85
a01 = y = = i=1= 6,83 a02 = i=1 = = 58,5
N 6 N 6
6 6
xi
60
x2i
760 s2x = a20 a10
2
= 126,67 102 = 26,67
a10 = x = = i=1= 10 a20 = i=1
= = 126,67
N 6 N 6

6
x i . yi 504 sxy = a11 a10 .a01 = 84 10. 6,83 = 15,7 covarianza
a11 = i=1 = = 84
N 6

b)

sy 3,44
y = 6,83 s y = 11,85 = 3,44 CVy = = = 0,5037 (50,37%dedispersin)
y 6,83

s x 5,16
x = 10 sx = 26,67 = 5,16 CVx = = = 0,516 (51,6%dedispersin)
x 10

Sedistribuyedeformamshomogneaelingresototaldelasfamilias.
6.Unpsiclogoafirma,basndoseenlosdatosobtenidos,queamedidaqueelniocrecemenores
sonlasrespuestasinadecuadasquedaeneltranscursodeunasituacinexperimental:

Nmerorespuestas Nmerorespuestas
Edad Edad
inadecuadas inadecuadas
2 11 7 12
3 12 9 8
4 10 9 7
4 13 10 3
5 11 11 6
5 9 11 5
6 10 12 5
7 7

a)Determinarlavalidezdelasconclusionesdelpsiclogo
b)Mara,dediezaosymedio,participaenelexperimento,culeselnmeroderespuestas
inadecuadasquesepuedepredecirparaella?
c)Hallarlavarianzaresidual

Solucin:
s xy
a)Lavalidezdelaafirmacinseobtendrenfuncindelcoeficientedecorrelacin: r =
sx sy

Comonohayparesrepetidosseentiendequeson15paresdelaforma (xi , y j ) querepresentar


xi : edad e yi : nmero respuestas inadecuada s demodoquelafrecuenciadecadapareslaunidad.

xi 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12
yi 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5

15
xi yi 2.11 + 3.12 + 4.10 + L + 11.5 + 12.5 789
a11 = i =1 = = = 52,6
N 15 15

15
xi 2 + 3 + 4 + 4 + 5 + L + 11 + 11 + 12 105
a10 = x = i =1 = = =7
N 15 15

15
yi 11 + 12 + 10 + 13 + L + 6 + 5 + 5 129
a01 = y = i =1 = = = 8,6
N 15 15

Enconsecuencia, sxy = a11 a10 a01 = 52,6 7 . 8,6 = 7,6

Paraelclculodelasdesviacionestpicas (sx , s y ) :
15
x2i 22 + 32 + 42 + 42 + 52 + L + 112 + 112 + 122 877
a20 = i =1 = = = 58,46
N 15 15

15
y2i 112 + 122 + 102 + 132 + L + 62 + 52 + 52 1237
a02 = i=1 = = = 82,46
N 15 15

s2x = a20 a10


2
= 58,46 72 = 9,46 a s x = 9,46 = 3,07

s2y = a02 a201 = 82,46 8,62 = 8,5 a s y = 8,5 = 2,91

s xy 7,6
Elcoeficientedecorrelacin: r = = = 0,85 correlacininversadel85%
sx sy 3,07 . 2,91

Lavalidezsolicitadaesdel85%encorrelacininversa,esdecir,amedidaqueaumentalaedaddel
nio(X)disminuyelasrespuestasinadecuadas(Y).

b)Parapoderpredecirelnmeroderespuestasparacadaedaddeterminada(casodeMara)ser
necesariohallarlaecuacinderegresindeY(nrespuestasinadecuadas)sobreX(edaddelnio):

sxy sxy
yy = (x x ) pendientedelarectacoeficientederegresin: byx =
s2x s2x

Advirtasequelapendientedelarectaocoeficientederegresin byx vienedeterminado


porelsignodelacovarianza sxy

sxy 7,6
byx = = = 0,80 (rectaderegresindecreciente)
s2x 9,46

Laecuacindelarectaderegresinser: y 8,6 = 0,80 (x 7) a y = 14 ,2 0,80 x

Enconsecuencia,paralaedaddeMara (x = 10,5) elnmeroderespuestasinadecuadasquesepuede


predecirser:

y = 14,2 0,80 .10,5 = 5,8 6 respuestasinadecuadas.

c)Lavarianzaresidual s r2 = s 2y ( 1 r 2 )

CoeficientedeDeterminacin: r 2 = (0,85) 2 = 0,7225

s r2 = s 2y ( 1 r 2 ) = 8,50 (1 0,7225) = 2,35875

sr2 2,35875
% var iaciones no exp licado = 100 2
= 100 = 27,75%
sy 8,50
7.Deunavariableestadsticabidimensional(X,Y)seconoce sx = 3 :
1
RectaderegresindeYsobreX: y = 2 + x
2
RectaderegresindeXsobreY: x = 4 + 2 y

a)Hallarelcoeficientedecorrelacin
b)Si x = 2 ,determinar y , a20 , a02 y a11

Solucin:
1
a)LarectaderegresindeYsobreX: y = 2 + x puedeescribirse:
2

1 1 1
y = 2 + x a y 0 = (4 + x) b yx =
2 2 2

Anlogamente,larectaderegresindeXsobreY: x = 4 + 2 y

x = 4 + 2 y a x 0 = 2 (2 + y) bxy = 2

sxy 1 sxy 1
byx = 2 = 2 9 = 2 sxy = 4 ,5
sx
Sabemosque sxy 4 ,5 4 ,5
bxy = = 2 a 2 = 2 a s2y = = 2,25 a s y = 2,25 = 1,5
2
sy sy 2

s xy 4 ,5
r= = = 1 conloqueexisteunadependenciafuncional,cosaquenoesdeextraarpor
sx sy 3 . 1,5
1
y =2+ x
tratarsedenicarectaderegresin.Advirtasequelasrectas: 2 sonlamismarecta,
x = 4 + 2 y
bastaconmultiplicarlaprimerarectapor2ydespejarlax:

1
2 y = 2 2 + x = 4 + x a x = 4 + 2 y
2

=2
x}
1 1 1
b) y = 2 + x a y = 2 + x a y = 2 + 2 = 3
2 2 2

s2x = a20 a10


2
a 32 = a20 22 a a20 = 32 + 22 = 13

s2y = a02 a201 a 2,25 = a02 32 a a02 = 2,25 + 32 = 11,25

sxy = a11 a11 a01 a 4 ,5 = a11 2 . 3 a a11 = 4 ,5 + 6 = 10,5


8.Enunaexperimentacinsobreelsectortursticosehanobservadodoscaracterescuantitativos(X,
Y),obtenindoselossiguientesresultados:

(0,2),(1,6),(3,14),(1,2),(2,10)

a)Hallarlasdistribucionesmarginales
b)Correlacinentreamboscaracteres
c)Cmocompletaramoslospares(3,),(,4)?.Utilizarparaellolarectaderegresinajustadaa
losdatosobservados.

Solucin:

a)Comonohayrepeticindelospares,latabladedobleentradadefrecuenciasabsolutasvendr
dadadelaforma:

X\Y 2 6 14 2 10 ni
0 1 1
1 1 1
3 1 1
1 1 1
2 1 1
n j 1 1 1 1 1 5

LasdistribucionesmarginalesdelaXeY,respectivamente,sern:

xi 0 1 3 1 2 yj 2 6 14 2 10
ni 1 1 1 1 1 n j 1 1 1 1 1

b)Paraestudiarlacorrelacinseformalatablaadjunta,dondenofiguralacolumnadelas
frecuenciasabsolutasporserlaunidadparatodoslospares

xi yi xi yi x2i y2i
0 2 0 0 4
1 6 6 1 36
3 14 42 9 196
1 2 2 1 4
2 10 20 4 100
5 30 70 15 340

5
xi yi 70
a11 = i=1 = = 14
N 5

5 5
xi 5
x2i 15 s2x = a20 a10
2
= 3 12 = 2 sx = 2 = 1,41
x = a10 = i=1 = =1 a20 = i=1 = =3
N 5 N 5
5 5
yi
30
y2i 340 s2y = a02 a201 = 68 62 = 32 sy = 32 = 5,66
y = a01 = =i=1 =6 a02 = i =1 = = 68
N 5 N 5

s xy 8
s xy = a11 a10 a01 = 14 1. 6 = 8 r= = =1
s 2x s 2y 2 . 32

Comoelcoeficientedecorrelacinesiguala1,indicaqueexisteunadependenciafuncionalentrelas
variables(X,Y)estudiadas.

c)Paracompletarelpar(3,)hayquehallarlaecuacindelarectaderegresindeYsobreX.
Anlogamente,paracompletarelpar(,4)hayquehallarlaecuacindelarectaderegresindeX
sobreY.

RectaderegresindeYsobreX:

sxy sxy
yy = (x x ) ,dondeelcoeficientederegresin byx = (pendientedelarecta)
s2x s2x

s xy 8
x = 1 y = 6 b yx = = =4
s2x 2

s xy
yy = (x x) a y 6 = 4 (x 1) a y = 2 + 4 x
s2x

Elpar(3,)secompleta: y = 2 + 4 (3) = 10 (3, 10)

RectaderegresindeXsobreY:

sxy sxy
xx = (y y) ,dondeelcoeficientederegresin bxy = (pendientedelarecta)
s2y s2y

sxy 8 1
x = 1 y = 6 bxy = = =
s2y 32 4

sxy 1 1
xx = (y y) a x 1 = (y 6) a x = ( 2 + y)
s2y 4 4

Elpar(,4)secompleta: x =
1
[ 2 + 4] = 1 1 ,
4
4 2 2
9.SedeseaestudiarlarelacinqueexisteentrelavariableX(porcentajedelapoblacinurbanaen
lasdistintasprovincias)eY(rentamediaporhogar).Latablaadjuntacontienedatosreferentesa
treintaprovincias:

X\Y 116 1631 3146 4660


1019 1 1 1
1928 8 3
2837 3 7 1
3745 2 3

a)Calcularlasrectasderegresin

Solucin:

a)
X\Y 116 1631 3146 4660 ni
1019 1 1 1 3
1928 8 3 11
2837 3 7 1 11
3745 2 3 5
n j 1 14 14 1 30

LasdistribucionesmarginalesdeXeY,respectivamente:

Intervalos xi ni xi ni x2i ni
1019 14,5 3 43,5 630,75
1928 23,5 11 258,5 6074,75
2837 32,5 11 357,5 11618,75
3745 41 5 205 8405
30 864,5 26729,25

4 4
xi ni 864,5
x2i ni 26729,25
x = a10 = i=1 = = 28,81 a20 = i =1 = = 890,975
N 30 N 30
s2x = a20 a10
2
= 890,975 28,812 = 60,959 sx = 60,959 = 7,807

Intervalos yj n j y j n j y2j n j
116 8,5 1 8,5 72,25
1631 23,5 14 329 7731,5
3146 38,5 14 539 20751,5
4660 53 1 53 2809
30 929,5 31364,25

4 4
y j n j y2j n j
j=1 929,5 j =1 31364,25
y = a01 = = = 30,98 a02 = = = 1045,475
N 30 N 30
s2y = a02 a201 = 1045,475 30,982 = 85,7146 sy = 85,7146 = 9,258

Ladistribucinconjunta

xi \ y j 8,5 23,5 38,5 53


14,5 1 1 1
23,5 8 3
32,5 3 7 1
41 2 3

4
xi yi nii 14 ,5. 8,5. 1 + 14 ,5. 23,5.1 + 14 ,5. 38,5.1 + 23,5. 23, 5.8 + L + 41. 38,5. 3 27589,5
a11 = i=1 = = = 919,65
N 30 30

sxy = a11 a10 a01 = 919,65 28,81. 30,98 = 27,1162

sxy 27,1162
9 RectaderegresindeYsobreX: y y = (x x) a y 30,98 = (x 28,81)
s2x 60,959

y = 18,30 + 0,44 x

m11 27,1162
Coeficientederegresin: b yx = = = 0,44 > 0 (rectaderegresincreciente)
2x 60,959

sxy 27,1162
9 RectaderegresindeXsobreY: x x = (y y) a x 28,81 = (y 30,98)
s2y 85,7146

x = 19,20 + 0,31 y

sxy 27,1162
Coeficientederegresin: bxy = = = 0,31 > 0 (rectaderegresincreciente)
s2y 85,7146

10.Justifiquelasrazonesporlascualesdebeaceptarseorechazarsequelasdosrectassiguientes
sean,respectivamente,laslneasderegresinmnimocuadrticasdeYsobreXydeXsobreYdeuna
seriedeobservaciones.

Y/X: Y = 2X + 1 X/Y: X = 5Y + 10

Solucin:

Y = 1 + 2X b yx = 2 > 0 Loscoeficientesderegresindebentenerelmismosigno,al
dependerambosdelamismacovarianza.
X = 10 5 Y bxy = 5 < 0
Conlocual,nopuedenserrectasderegresin.
11.Justifiquelasrazonesporlascualesdebeaceptarseorechazarsequelasdosrectassiguientes
sean,respectivamente,laslneasderegresinmnimocuadrticasdeYsobreXydeXsobreYdeuna
seriedeobservaciones.

Y/X: Y = 2X + 1 X/Y: X = 5Y + 10

Solucin:

Y = 1 + 2X b yx = 2 > 0 Loscoeficientesderegresintienenelmismosigno,loquees

X = 10 + 5 Y bxy = 5 > 0 lgicoaldependerambosdelamismacovarianza.

Deotraparte,elcoeficientedecorrelacin: r = b yx . b xy = 2 . 5 = 3,16 ,resultadoabsurdocuando


elcoeficientedecorrelacin 1 r 1 ,concluyendoquenopuedenserrectasderegresin.

12.ElcoeficientedecorrelacinentredosvariablesXeYes0,6.Sabiendoademsque,
x = 10 sx = 1,5 y = 20 s y = 2
a)HallarlasrectasderegresindeY/XydeX/Y
b)Calcularlavarianzaresidualparalasdosregresionesanteriores

Solucin:

sxy sxy
RectaderegresindeYsobreX: y y = (x x) a byx = (coeficienteregresin)
s2x s2x
sxy sxy
RectaderegresindeXsobreY: x x = (y y) a bxy = (coeficienteregresin)
s2y s2y

s xy s xy
Elcoeficientedecorrelacin: r = b yx . b xy = a 0,6 = a s xy = 1,8
sx .sy 1,5 . 2

sxy 1,8 s 1,8


Enconsecuencia, byx = = = 0,8 bxy = xy
2
= 2 = 0,45
s2x 1,52
sy 2

Y / X : y 20 = 0,8 (x 10) y = 12 + 0,8 x


Lasrectasderegresinsern:
X / Y : x 10 = 0,45 (y 20) x = 1 + 0,45 y


[
Y / X s r2 = s 2y 1 r 2 ] Y/X s =s
r y 1 r2
b)Varianzaresidual Errortpicoestimacin
X / Y s2 = s2 1 r2
r x [ ] X/Y s =s
r x 1 r2

[
Y / X sr2 = 22 1 0,62

]
a sr2 = 2,56 sr = 2,56 = 1,6
portanto,

r [ r ]
X / Y s2 = 1,52 1 0,62 a s2 = 1,44 s = 1,44 = 1,2
r
13.Enunadistribucinbidimensionalseconoce:

R = 0,7 sx = 1,2 y=4 X / Y : X = 0,6 + 0,44 Y

Obtener:

a)MediadeX
b)RectaderegresindeY/X
c)VarianzadeY
d)Covarianzadeambasvariables

Solucin:

X = 0,6 + 0,44 Y
a)RectaderegresindeXsobreY: X = 0,6 + 0,44 Y a
X = 0,6 + 0,44 . 4 = 2,36

b)LarectaderegresindeY/X:

a = 0,6
siendo X = 0,6 + 0,44 Y a
bxy = 0,44

0,72
r 2 = b yx . b xy a 0,72 = b yx . 0,44 a b yx = = 1,114
0,44

byx
}
sxy
conlocual,larectaderegresindeYsobreX: y y = (x x ) ser: y 4 = 1,114 (x 2,36)
s2x
y = 1,370 + 1,114 x

c)VarianzadelaY:Sabemosque, s x = 1,2 bxy = 0,44 b yx = 1,114

m11 sxy
byx = a 1,114 = a sxy = 1,114 .1,22 = 1,604
2x 1,2 2

sxy 1,604 1,604


recurriendoa bxy = a 0,44 = a s2y = = 3,645
s2y s2y 0,44

d)Lacovarianzadeambasyasehacalculado: sxy = 1,604


14.Seanlasvariablesestadsticasbidimensionales(X,Y),dondeX="PIBpercpita(enmilesde
dlares)eY="Tasanaturaldecrecimientodemogrficode162pasesdelmundo".Seconocenlos
datossiguientes:

x = 978,9 y = 2886,4 xy = 8938,4


x2 = 17569,9 y2 = 172291,2
a)Obtenerlarectaderegresinquepretendeexplicarlatasanaturaldecrecimientoenfuncindela
rentadelpas.
b)Interpretarloscoeficientesdelarectaestimada.
c)Obtenerunamedidadebondaddelajusteeinterpretarsisteesbueno.

Solucin:
yxb
}
sxy
a)SetratadeencontrarlarectaderegresindeYsobreX: y y = (x x )
s2x

a10 = x = = = 6,04 a20 = =


x 978,9 x2 17569,9
= 108,456
N 162 N 162

s2x = a20 a10


2
= 108,456 6,042 = 71,97

a01 = y = = = 17,82 a02 = =


y 2886,4 y2 172291,2
= 1063,526
N 162 N 162

s2y = a02 a201 = 1063,526 17,822 = 745,97

a11 = =
x y 8938,4
= 55,175 sxy = a11 a10 a01 = 55,175 6,04 . 17,82 = 52,46
N 162

sxy 52,46
ElcoeficientederegresindeYsobreX(pendientedelarecta): byx = = = 0,729
s2x 71,97

Advirtasequelapendientedelarecta ( 0,729) enelsignodependedelacovarianza (sxy ) ,alser


negativalarectaderegresinserdecreciente,estoes,amedidaqueaumentalosvaloresdela
variableX(PIBpercpita)disminuyenlosvaloresdelavariableY(tasanaturaldecrecimiento
demogrfico).

Larectaderegresinsolicitadaser: y 17,82 = 0,729 (x 6,04) a y = 22,22 0,729 x

c)ElCoeficientededeterminacinlineal: r 2 = b yx . b xy

sxy 52,46
bxy = = = 0,07
s2y 745,97

conloque, r 2 = (0,729) . (0,07) = 0,051 (5,1%gradodefiabilidad)


Elcoeficientedecorrelacinlineal: r = 0,051 = 0,226 (noexisteapenascorrelacinlinealentrelas
variables,pudiendoexistirotrotipodecorrelacin)

15.Lasiguientedistribucinbidimensionalseexpresaenlasiguientetabladecorrelaciones.La
variableXrepresentalosingresosfamiliaresmensualesenunidadesde10euros.LavariableY
representa,asuvez,losmetroscuadradosdelaviviendafamiliar.

X/Y <60 6080 80100 100150 >150


50100 20 18 2 1 0
100200 25 40 30 2 1
200350 5 10 15 25 3
350500 0 5 15 20 8
>500 0 1 2 7 10

a)Calcularladistribucinmarginaldelasdosvariables.Sonindependienteslosingresosfamiliares
yeltamaodelaviviendadondehabitan?
b)Obtenerladistribucindelasuperficiedelaviviendacondicionadaalintervalomodaldelos
ingresosfamiliares.
c)Calcularladistribucindelosingresoscondicionadaalintervalomedianodelaviviendafamiliar.

Solucin:

a)

ni
X/Y <60 6080 80100 100150 >150 ni fi =
N
50100 20 18 2 1 0 41 0,155
100200 25 40 30 2 1 98 0,370
200350 5 10 15 25 3 58 0,219
350500 0 5 15 20 8 48 0,181
>500 0 1 2 7 10 20 0,075
n j 50 74 64 55 22 N=265 1
n j
f j = 0,189 0,279 0,242 0,208 0,083 1
N

Paraquelosingresosfamiliares(X)yeltamaodelaviviendafamiliar(Y)seanindependientesdebe
n n n
verificarse ij = i j i, j
N N N
n n n 15 48 64
Nosonindependientesporque 43 4 3 a
N 4 N 265 265 265
DISTRIBUCINMARGINALDELAVARIABLEX
ni Ni ni
Intervalos xi ni ci fi = Ni Fi = hi =
N N ci
50100 75 41 50 0,155 41 0,155 0,82
100200 150 98 100 0,370 139 0,525 0,98
200350 275 58 150 0,219 197 0,744 0,39
350500 425 48 150 0,181 245 0,925 0,32
>500 20 0,075 265 1
265 1

DISTRIBUCINMARGINALDELAVARIABLEY
n j N j nj
Intervalos yj n j cj f j = Nj F j = hj =
N N cj
<60 50 0,189 50 0,189

N/2=132,
6080 70 74 20 0,279 124 0,468 3,7
80100 90 64 20 0,242 188 0,71 3,2 mediano
100150 125 55 50 0,208 243 0,918 1,1
>150 22 0,083 265 1
265 1

b)X="ingresosfamiliares"eY="metroscuadradosdelasuperficie"

yj n j / 50 100 nj / 100 200 nj / 200 350 n j / 350 500 nj / > 500


<60 20 25 5 0 0
6080 18 40 10 5 1
80100 2 30 15 15 2
100150 1 2 25 20 7
>150 0 1 3 8 10
41 98 58 48 20

ConlosdatosdisponiblesnosepuedecalcularelintervalomodaldelavariableX,alnopodercalcular
todaslasdensidadesdefrecuenciasmarginales,esimposiblehacerloeneltramo(>500)quetiene
unaamplitudilimitada.

c)LadistribucincondicionadadelavariableXalintervalomedianodelaY(viviendafamiliar):

X /Y <60 6080 80100 100150 >150 Intervalos ni3 (ni / 80 100)


50100 20 18 2 1 0 50100 2
100200 25 40 30 2 1 100200 30
200350 5 10 15 25 3 200350 15
350500 0 5 15 20 8 350500 15
>500 0 1 2 7 10 >500 2
Y / X : Y = 3 + 2X
16.Seconocenlasregresiones
X / Y : X = 2 + 0,3 Y
Sabiendoademsque s xy = 3,2 .Obtenerlavarianzaresidualdelasdosrectasderegresin.

Solucin:

b = s / s2 s xy = 3,2
Y / X : Y = 3 + 2X byx = 2 yx xy x s2x = 3,2 / 2 = 1,6
a b = 0,3 a s xy = 3,2
X / Y : X = 2 + 0,3 Y xy 2
bxy = sxy / s y s2y = 3,2 / 0,3 = 10,67

Porotraparte,elcoeficientededeterminacin: R2 = byx .bxy = 2. 0,3 = 0,6

[ ]
Y / X : s r2 = s 2y 1 r 2 s r2 = 10,67 [ 1 0,6] = 4 ,268

Varianzaresidual

r x r [ ]
X / Y : s 2 = s 2 1 r 2 s 2 = 1,6 [ 1 0,6] = 0,64

Y/X: s =s 1 r2 sr = 4 ,268 = 2,066


r y
Errortpicoestimacin
X/Y: s =s 1 r2 sr = 0,64 = 0,8
r x

17.Seanlassiguientesecuacioneslasrectasderegresindeunavariablebidimensional(Y,X;nij)
X 2Y = 3

X 4Y = 2

a)CuldeestasrectascorrespondealaregresindeY/XyculalaregresindeX/Y?
b)HallarlasmediasaritmticasdeYsobreX
c)Cuntovaleelcoeficientedecorrelacinlineal?

Solucin:

a)

a = 3
X = 3 + 2Y a
bxy = 2
recta regresin X / Y
X 2Y = 3
Sea a signo (bxy ) = signo (b yx )
recta regresin Y / X a' = 1 / 2
X 4 Y = 2 1
Y = + X a1


2 4 b yx = 1 / 4

1
Coeficientededeterminacin r 2 = b xy . b yx = 2 . = 0,5 < 1
4
3 1 a = 3 / 2
Y = + X a
b yx = 1 / 2
recta regresin Y / X
X 2Y = 3 2 2
Sea a signo (b yx ) = signo (bxy )
'
X = 2+ 4Y a a = 2
recta regresin X / Y
X 4 Y = 2

bxy = 4

1
Coeficientededeterminacin r 2 = b yx . b xy = . 4 = 2 > 1 cosaquenoesposible (0 r 2 1)
2


X / Y : X = 3 + 2Y

Enconsecuencia
1 1
Y / X : Y = 2 + 4 X

18.Enunadistribucinbidimensional(Xi,Yj,nij)seconoce x = 10 y sxy = 10 .Ambasrectasde


regresinpasanporelpunto(0,0).Culeselgradodebondaddelajuste?.

Solucin:

LasrectasderegresindeY/XeX/Ysecortanen (x , y) ,enestecasoenelpunto (10, y) .

Porotraparte,segnelenunciadosecortanen(0,0),porloquesepuedeconcluirqueambasrectas
coincidenaltenerdospuntosdistintosencomn.

Enconsecuencia,R2=1R=1(100%gradodeajuste).

19.ApartirdeunconjuntodedatossobrelasvariablesXeYsehacalculadolaregresindeYsobre
X,obtenindoselossiguientesresultados:

Y = 10 + 0,45 X r2 = 0,9 x = 20

CalcularlosparmetrosderegresindeXsobreY

Solucin:

a = 10 r2 = byx .bxy 0,9


Y = 10 + 0,45 X a r2 = 0,9 = 0,45.bxy bxy = = 2 (pendiente recta)
b yx = 0,45 0,45

byx
} y = a + b. x
Deotraparte, y = a + b . x y = 10 + 0,45 . 20 = 19
bxy b
} x = a' + b'. y
}xy
Anlogamente, x = a'+ b' . y a' = x b' . y a' = 20 2.19 = 18

LarectaderegresindeX/Y: Y = 18 + 2 X
20.CulesdelossiguientesparesdeposiblesrectasderegresindeY/XydeX/Yrealmente
puedenserlo?.Razonelarespuesta.

a) Y = 3 + 4X siendo X = 2 + Y b) Y = 3 + 2X siendo X = 2 0,3 Y c) Y = 3 + 2X siendo X = 2 + 0,2 Y

Solucin:

a=3
Y / X : Y = 3 + 4 X a
b yx = 4 > 0 signo (b yx ) = signo (b xy )
a 2
X / Y : X = 2 + Y a a' = 2 r = b yx . b xy = 4.1 = 4 > 1 contradiccin
b xy = 1 > 0

a=3
Y / X : Y = 3 + 2X a
byx = 2 > 0
a signo (byx ) signo (bxy ) contradiccin
X / Y : X = 2 0,3 Y a a' = 2
bxy = 0,3 < 0

a=3
Y / X : Y = 3 + 2X a
b yx = 2 > 0 signo (b yx ) = signo (b xy )
a 2 coeficientes coherentes
X / Y : X = 2 + 0,2 Y a a' = 2 r = b yx . b xy = 2 . 0,2 = 0,4 < 1
b xy = 0,2 > 0

21.Comprobarsisoncoherenteslosresultadosobtenidosalajustarlarectaderegresin:
a) Y = A + b X a sxy = 20 s2x = 10 y =8 x =4 a=3
b) Y = A + b X a s2y = 4 s xy = 4 2
sry = 0,4 s2x = 5

Solucin:

a)
s xy 20
b = b yx = 2 = 10 = 2
sx Los datos no corresponden
Y = A + bX a

y = a + b x a a = y b x = 8 2. 4 = 0 3 a la recta de regresin

b)Losdatosnocorrespondenaunarectaderegresincomopuedeobservarse.

2
sry = s2y (1 r2 ) a 0,4 = 4 (1 r2 ) a 0,1 = (1 r2 ) a r2 = 0,9 a r = 0,94
s xy 4
Y = a + b X a b = b yx = 2 = = 0,8
sx 5
2 2
s xy 2
sry 2 42
2
sry 0,4
r = 2 2
= 1 2
a r = = 0 ,8 1 2
= 1 = 0,9
sx .s y sy 5. 4 sy 4

22.Enunadistribucinbidimensional(X,Y)sehaajustadounaregresinlinealentrelasdos
variables.Sesabeque r = 0,8, s x = 4 , y = 2 yquelarectaderegresindeXsobreYajustadaes
Y = 4X .Sepide:

a)Calcularlosvaloresde sxy , s2y y x


b)CalcularlarectaderegresindeYsobreX
c)CalcularlavarianzaresidualenlaregresindeXsobreY

Solucin:

a)
sxy
x x = 2 (y y)
RectaderegresindeXsobreY sy

Y = 4X
X = 1 Y x =a'+b'y a' = 0

4 b' = bxy = 1 / 4 (pendiente recta)

}b } b'
1
r = b yx .bxy a 0,82 = b yx .
2
a b yx = 2,56
4
covarianza (sxy ) b
}
b = sxy a s = b . s2 a s = (2,56). 42 = 40,96
yx s2x xy yx x xy

}b'
sxy sxy 40,96
VarianzaY (s2y ) bxy = 2 a s2y = a s2y = = 163,84
sy bxy 1/4

r
E[x ]=E[a'+b'y ] a x =a'+b'y 1
MediaX (x) x = a'+b' y x = 0 + . 2 = 0,5
4

b)
b=byx
}
s
RectaderegresindeYsobreX y y = xy (x x ) a y = a + b x
s2x
40,96
y 2 = 2 (x 0,5) a y = 0,72 + 2,56 x
4

2
c) VarianzaresidualdeX: srx = s2x (1 r2 ) a srx
2
= 16 (1 0,64) = 5,76
23.Sedeseaestudiarlarepercusinquetienelosdasdelluviaenelnmerodevisitasalzoo.Para
ello,seobservaronlassiguientesvariables,durantelosltimosdiezaos,siendoY="nvisitas
anuales,enmiles"yX="ndedasdelluviaalao":

Ao 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
X 18 26 30 33 38 39 42 44 46 49
Y 107 105,5 105 104,4 104,3 104 103,7 103,4 103,1 103

a)Coeficientedecorrelacinlinealeinterpretarelresultado.
b)Rectaderegresinqueexpliqueelnmerodevisitasanualesenfuncindelnmerodelluvia.
c)QuprevisindevisitashabrparaelaoprximosielInstitutoMeteorolgicoinformaque
llover40das?.Qugradodefiabilidadtendrestaprediccin?.
d)Hallarlavarianzaresidualdelnmerodevisitasanuales.
e)ObtenerlarectaderegresinX/Y.

Solucin:

Ao xi yi xi . yi x2i y2i
1994 18 107 1926 324 11449
1995 26 105,5 2743 676 11130,25
1996 30 105 3150 900 11025
1997 33 104,4 3445,2 1089 10899,36
1998 38 104,3 3963,4 1444 10878,49
1999 39 104 4056 1521 10816
2000 42 103,7 4355,4 1764 10753,69
2001 44 103,4 4549,6 1936 10691,56
2002 46 103,1 4742,6 2116 10629,61
2003 49 103 5047 2401 10609
10 365 1043,4 37978,2 14171 108881,96

DistribucinmarginaldeX
10 10
xi 365
x2i
14171
s2x = a20 a10
2
= 1417,1 36,52 = 84 ,85
a10 = x = i=1 = = 36,5 a20 = i=1 = = 1417,1
N 10 N 10 sx = 84 ,85 = 9,21

DistribucinmarginaldeY
10 10
yi 1043,4
y2i 108881,96
a01 = y = i=1 = = 104,34 a02 = i=1 = = 10888,196
N 10 N 10

s2y = a02 a201 = 10888,196 104,342 = 1,36



s y = 1,36 = 1,17
CovarianzaCoeficientesregresinlinealCoeficientecorrelacinlineal
10
xi . yi 37978,2
a11 = i=1 = = 3797,82
N 10
Covarianza: sxy = a11 a10 . a01 = 3797,82 36,5 . 104,34 = 10,59

}b
sxy 10,59
Y / X : b yx = 2 = = 0,125
sx 84 ,85
Coeficientesregresinlineal: } b'
X / Y : b = sxy = 10,59 = 7,79
xy
s2y 1,36

Coeficientedecorrelacinlineal: r = b yx .bxy = (0,125)(7,79) = 0,986

Observandolagrficadelanubedepuntosamsdasdelluvia
menornmerodevisitas. Elgradodeajusteentrelanubede
puntosylarectaderegresinesdel98,6%.

b)RectaderegresindeYsobreX:
b=byx
}
s yx
y y = (x x) a y 104,34 = 0,125 (x 36,5) a y = 108,90 0,125x
s2x

c)Sien2007seestiman40dasdelluviaseestimanunnmerodevisitas:

y = 108,90 0,125 (40) 104 das

d)LavarianzaresidualdelaY:
2
sry = s2y (1 r2 ) a sry
2
= 1,36 (1 0,9862 ) = 0,0378 (3,78%causasajenasalaregresin)

e)RectaderegresindeXsobreY:
b'=bxy
}
s yx
x x = (y y) a x 36,5 = 7,79 (y 104,34) a x = 849,31 7,79 y
s2y

849,31 x
X / Y : x = 849,31 7,79 y a y =
7,79

NOTA.PararepresentarconjuntamenteenEXCELlasdosrectasderegresin(Y/X,X/Y)sehande
introducirdosseries:Serie1(X,Y),Serie2(X, Y)
24.LasnotasenEstadstica(X)yenMatemticas(Y)obtenidaspor10alumnoselegidosalazarenun
grupodeprimercursodelaFacultaddeCienciasEconmicasyEmpresarialeshansidolassiguientes,
segnelordendeseleccindelamuestra:

Norden 1 2 3 4 5 6 7 8 9 10
X 9 7 3 6 7 5 10 8 3 5
Y 8 5 4 2 9 6 10 9 1 5

a)Representarlanubedepuntoscorrespondienteaestadistribucin.Quhiptesispueden
hacersealavistadelarepresentacin?.
b)EstimarlosparmetrosdelarectaderegresinY/X.Interpretarloscoeficientescalculados.
c)EstimarlosparmetrosdelarectaderegresindeX/Yycompararambasrectas.
d)Representarlasdosrectasderegresinjuntoalanubedepuntos.
e)CalcularlavarianzaresidualenlaregresinY/X.Coincidirconlavarianzaresidualenla
regresinX/Y?
f)Paraunalumnoquehayaobtenidoun7enMatemticas,qunotaselepronosticaraen
Estadstica?
g)Paraunalumnoquehayaobtenidoun4enEstadstica,qunotaselepronosticaraen
Matemticas?

Solucin:

a)

Observandolanubedepuntos(diagramadedispersin)se
puedeestablecerlahiptesisdequeexistecorrelacinlineal
crecienteentrelasvariables.

b)EstimarlosparmetrosdelarectaderegresinY/X

Norden 1 2 3 4 5 6 7 8 9 10
xi 9 7 3 6 7 5 10 8 3 5 63
yi 8 5 4 2 9 6 10 9 1 5 59
xi . yi 72 35 12 12 63 30 100 72 3 25 424
x2i 81 49 9 36 49 25 100 64 9 25 447
y2i 64 25 16 4 81 36 100 81 1 25 433

DistribucinmarginaldeX
10 10
xi x2i s2x = a20 a10
2
= 44 ,7 6,32 = 5,01
i=1 63 i=1 447
a10 = x = = = 6,3 a20 = = = 44 ,7 sx = 5,01 = 2,24
N 10 N 10
DistribucinmarginaldeY
10 10
s2y = a02 a201 = 43,3 5,92 = 8,49
yi 59
y2i 433
a01 = y = i=1 = = 5,9 a02 = i=1 = = 43,3 s y = 8,49 = 2,91
N 10 N 10

CovarianzaCoeficientesregresinlinealCoeficientecorrelacinlineal
10
xi . yi 424 Covarianza: sxy = a11 a10 .a01 = 42,4 6,3 . 5,9 = 5,23
a11 = i=1 = = 42,4
N 10

s xy 5,23
b = b yx = 2 = = 1,044 > 0
sx 5,01
ParmetrosregresinlinealY/X
Y = a + b X a Y = 0,677 + 1,044 X y = a + b x a a = y b x = 5,9 1,044 . 6,3 = 0,677
2 s xy s xy 5,23 5,23
r = 2 . 2 = . = 0,643 a r = 0,643 = 0,80
sx s y 5,01 8,49

Elcoeficientederegresinbespositivo,conlo
queamayornotaenestadsticamayornotaen
matemticas.Deotraparte,elcoeficientede
correlacinres0,80,conloquelafiabilidaddel
modeloesdel80%.

c)

sxy 5,23
b' = bxy = 2 = = 0,616 > 0
s y 8 ,49
ParmetrosregresinlinealX/Y
X = a' + b' Y a X = 2,665 + 0,616 Y x = a' + b' y a a' = x b' y = 6,3 0,616 . 5,9 = 2,665
2 sxy sxy 5,23 5,23
r = 2 . 2 = . = 0,643 a r = 0,643 = 0,80
s x s y 5,01 8,49

Elcoeficientederegresinb'espositivo,conloquea
mayornotaenmatemticasmayornotaenestadstica.
X 2,665
Deotraparte, X = 2,665 + 0,616 Y a Y = se
0,616
utilizapararepresentarenExcellaserie (X , Y) ,quejunto
alaserie(X,Y),permitelagrficaconjuntadelanubede
puntosylasdosrectasderegresin.
d)PararepresentarenExcellasdosrectasderegresinjuntoalanubedepuntos.

X 9 7 3 6 7 5 10 8 3 5
Y 8 5 4 2 9 6 10 9 1 5
Y 10,28 7,04 0,54 5,41 7,04 3,79 11,91 8,66 0,54 3,79

Diagramadispersin:Series(X,Y),(X, Y)
Y = (X 2,665) / 0,616

e)Varianzasresiduales

VarianzaresidualdeY/X: r2 = 0,643 s2y = 8,49 2


sry = s2y (1 r2 ) a sry
2
= 8,49 (1 0,643) = 3,03

VarianzaresidualdeX/Y: r2 = 0,643 s2y = 5,01 2


srx = s2x (1 r2 ) a srx
2
= 5,01 (1 0,643) = 1,79

f)Unalumnoconun7enMatemticas (, 7) parapronosticarlanotaenEstadsticahabraque
recurriralarectaderegresindeX/Y: X = 2,665 + 0,616 Y

X = 2,665 + 0,616.7 = 6,98 enestadstica

g)Unalumnoconun4enEstadstica (4 , ) parapronosticarlanotaenMatemticashabraque
recurriralarectaderegresindeY/X: Y = 0,677 + 1,044 X

Y = 0,677 + 1,044 . 4 = 3,50 enmatemticas

También podría gustarte