Está en la página 1de 3

𝑫𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒄𝒊𝒐𝒏𝒆𝒔 𝒎𝒂𝒓𝒈𝒊𝒏𝒂𝒍𝒆𝒔 𝒚 𝒄𝒐𝒏𝒅𝒊𝒄𝒊𝒐𝒏𝒂𝒅𝒂𝒔.

ℎ = ℎ ∗ · ℎ | = ℎ∗ · ℎ |
𝑰𝒏𝒅𝒆𝒑𝒆𝒏𝒅𝒆𝒏𝒄𝒊𝒂 ∀𝑖, 𝑗 ℎ = ℎ ∗ · ℎ∗ 𝑡𝑎𝑚𝑏𝑖é𝑛: 𝑙𝑎𝑠 𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 𝑠𝑜𝑛 𝑝𝑟𝑜𝑝𝑜𝑟𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠
𝑒𝑛𝑡𝑟𝑒 𝑠í 𝑦 𝑐𝑜𝑛 𝑙𝑎 𝑚𝑎𝑟𝑔𝑖𝑛𝑎𝑙
∑𝑥 · 𝑦 · 𝑓 𝑠 > 0 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑖𝑟𝑒𝑐𝑡𝑎
𝑪𝒐𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂: 𝑠 = −𝑥·𝑦
𝑁 𝑠 < 0 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑖𝑛𝑣𝑒𝑟𝑠𝑎
No es una buena para establecer la bondad de ajuste pues depende de las unidades de medida.
𝑠
𝑹𝒆𝒄𝒕𝒂 𝒓𝒆𝒈𝒓𝒆𝒔𝒊ó𝒏 𝒀 𝒔𝒐𝒃𝒓𝒆 𝑿: 𝑦−𝑦 = (𝑥 − 𝑥)
𝑠
𝐿𝑎𝑠 𝑝𝑟𝑒𝑑𝑖𝑐𝑐𝑖𝑜𝑛𝑒𝑠 𝑠𝑜𝑙𝑜 𝑠𝑜𝑛 𝑎𝑐𝑒𝑝𝑡𝑎𝑏𝑙𝑒𝑠 𝑠𝑖 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑎 𝑒𝑠𝑡𝑖𝑚𝑎𝑟 𝑒𝑠𝑡á 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒𝑙 𝑟𝑎𝑛𝑔𝑜
𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠.
𝑠
𝐿𝑎 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 , , 𝑒𝑠 𝑒𝑙 𝒄𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝒓𝒆𝒈𝒓𝒆𝒔𝒊ó𝒏
𝑠
𝑠
𝐸𝐶𝑀 = 𝑠 1− 𝑬𝒓𝒓𝒐𝒓 𝒄𝒖𝒂𝒅𝒓á𝒕𝒊𝒄𝒐 𝒎𝒆𝒅𝒊𝒐 ó 𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝒓𝒆𝒔𝒊𝒅𝒖𝒂𝒍
𝑠 ·𝑠
𝑀𝑖𝑑𝑒 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑐𝑢𝑎𝑑𝑟á𝑡𝑖𝑐𝑎 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑝𝑢𝑛𝑡𝑜𝑠 𝑎 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎.

𝑃𝑎𝑟𝑎 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑟 𝑙𝑎 𝑏𝑜𝑛𝑑𝑎𝑑 𝑑𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 𝑠𝑒 𝑢𝑠𝑎𝑛 (𝑝𝑢𝑒𝑠 𝑠𝑜𝑛 𝑎𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑎𝑙𝑒𝑠):


𝑠
𝑪𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝒅𝒆𝒕𝒆𝒓𝒎𝒊𝒏𝒂𝒄𝒊ó𝒏: 𝑅 = 0≤𝑅 ≤1. 𝐸𝑥𝑝𝑟𝑒𝑠𝑎𝑑𝑜 𝑒𝑛 %,
𝑠 ·𝑠
𝑖𝑛𝑑𝑖𝑐𝑎 𝑒𝑙 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑌 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑜 𝑝𝑜𝑟 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛.
𝑠
𝑪𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝒄𝒐𝒓𝒓𝒆𝒍𝒂𝒄𝒊ó𝒏: 𝑟 = ; −1 ≤ 𝑟 ≤ 1 𝑐𝑢𝑎𝑛𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 𝑠𝑒𝑎
𝑠 ·𝑠

|𝑟| 𝑚𝑒𝑗𝑜𝑟 𝑠𝑒𝑟á 𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 𝑙𝑖𝑛𝑒𝑎𝑙. 𝑟 𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑠𝑖𝑔𝑛𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 > 0 𝑟𝑒𝑙. 𝑑𝑖𝑟𝑒𝑐𝑡𝑎
< 0 𝑟𝑒𝑙. 𝑖𝑛𝑣𝑒𝑟𝑠𝑎
Tabla de Guilford |r| Relación lineal
0 nula
( 0 , 0.2 ) muy baja
[ 0.2 , 0.4 ) baja
[ 0.4 , 0.6 ) moderada
[ 0.6 , 0.8 ) alta
[ 0.8 , 1 ) muy alta
1 perfecta

Todos estos cálculos están basados en la construcción de un modelo lineal bajo la hipótesis
de que puede existir dicha relación entre nuestras variables. El epígrafe 6, junto al
comentario “Relación de causalidad entre las variables” (pág. 327 libro) es muy ilustrativo.
Ejercicio: Se han medido, en cm, los diámetros (x) de 100 árboles a 1.50 m del suelo y las
alturas (y), en metros, de dichos árboles. Los resultados una vez agrupados en clases son:
[ 5, 7) [ 7, 9) [ 9,11) [11,13) [13,15) [15,17) [17,19) Marginal
x y fi*
6 8 10 12 14 16 18
[ 25, 35) 30 1 1 0 0 0 0 0 2
[ 35, 45) 40 2 10 8 5 0 0 0 25
[ 45, 55) 50 0 1 14 13 15 1 0 44
[ 55, 65) 60 0 0 3 9 6 5 0 23
[ 65, 75) 70 0 0 0 1 2 2 1 6
Marginal f*j 3 12 25 28 23 8 1 100
(Tanto las marginales como las marcas de clase, las tendría que poner el alumno. Si se han puesto en la tabla
de datos es por no repetirla. Los colores fila4 y col6 son para los apartados b) y c) respectivamente)

a) Medias y varianzas de las marginales. Lo haremos con tablas separadas.

𝑦 𝑓∗ 𝑦 · 𝑓∗ 𝑦 · 𝑓∗
6 3 18 108
𝑥 𝑓∗ 𝑥 · 𝑓∗ 𝑥 · 𝑓∗ 8 12 96 768
30 2 60 1800 10 25 250 2500
40 25 1000 40000 12 28 336 4032
50 44 2200 110000 14 23 322 4508
60 23 1380 82800 16 8 128 2048
70 6 420 29400 18 1 18 324
100 5060 264000 100 1168 14288
5060 264000
𝑥= = 50.6 𝑐𝑚 ; 𝑠 = − 50.6 = 79.64 𝑐𝑚
100 100

1168 14288
𝑦= = 11.68 𝑚 ; 𝑠 = − 11.68 = 6.4576 𝑚
100 100
b) La media y la desviación típica de la distribución de alturas condicionada a un
diámetro de 60 cm.
𝐶𝑜𝑔𝑒𝑚𝑜𝑠 𝑙𝑎 𝑓𝑖𝑙𝑎 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑎 𝑥 = 60 (𝑙𝑎 𝑐𝑜𝑙𝑜𝑐𝑎𝑚𝑜𝑠 𝑒𝑛 𝑣𝑒𝑟𝑡𝑖𝑐𝑎𝑙)
𝑦 𝑓 𝑦 ·𝑓 𝑦 ·𝑓 c) 302
6 0 0 0 d)𝑦 (𝑥 = 60) = 23 = 13.1304 𝑚
8 0 0 0 e)
4052
10 3 30 300 f)𝑠 ⁄( ) = − 13.1304 = 3.7665 𝑚
23
12 9 108 1296 g)
14 6 84 1176 h)𝑠
⁄( ) = 𝑠 ⁄( ) = √3.7665 = 1.9407 𝑚
16 5 80 1280 i)
18 0 0 0 j)
23 302 4052 k)
c) La media y la desviación típica de la distribución de diámetros condicionada a una
altura de 16 m.
𝐶𝑜𝑔𝑒𝑚𝑜𝑠 𝑙𝑎 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 𝑐𝑜𝑟𝑟𝑒𝑠𝑝𝑜𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑎 𝑦 = 16

𝑥 𝑓 𝑥 ·𝑓 𝑥 ·𝑓 490
𝑥 (𝑦 = 16) = = 61.25 𝑐𝑚
30 0 0 0 8
40 0 0 0 30300
𝑠 ⁄( ) = − 61.25 = 35.9375 𝑐𝑚
50 1 50 2500 8
60 5 300 18000
70 2 140 9800 𝑠 ⁄( ) = 𝑠 ⁄( ) = √35.9375 = 5.9948 𝑐𝑚
8 490 30300

d) La covarianza. Recta de regresión de y sobre x y coeficientes de correlación y


determinación de x e y . El ECM
Como os indiqué en clase, hay una manera de hacerlo en la tabla original, sin tener
que copiar todos los datos. Como preferís esta última forma, lo haré así.
Para ahorrar espacio y tiempo, no pondré las parejas cuya frecuencia es cero.

𝑥 𝑦 𝑓 𝑥 ·𝑦 ·𝑓 COVARIANZA

30 6 1 180 ∑𝑥 · 𝑦 · 𝑓 60620
30 8 1 240 𝑠 = −𝑥·𝑦 = − 50.6 · 11.68
𝑁 100
40 6 2 480
𝑠 = 15.192 𝑐𝑚 𝑚
40 8 10 3200
40 10 8 3200 RECTA DE REGRESIÓN DE Y SOBRE X

40 12 5 2400 𝑠 15.192
50 8 1 400 𝑦−𝑦 = (𝑥 − 𝑥) ; 𝑦 − 11.68 = (𝑥 − 50.6)
𝑠 79.64
50 10 14 7000
50 12 13 7800 𝑦 = 0.1908𝑥 + 2.0276
50 14 15 10500 COEFICIENTE DE DETERMINACIÓN
50 16 1 800
𝑠 15.192
60 10 3 1800 𝑅 = = = 0.4488
𝑠 ·𝑠 79.64 · 6.4576
60 12 9 6480
60 14 6 5040 Esto quiere decir que el 44.88% de la variación de la
60 16 5 4800 altura del árbol se explica por el diámetro.
70 12 1 840
COEFICIENTE DE CORRELACIÓN
70 14 2 1960
70 16 2 2240 𝑠
𝑟= = +√0.4488 = 0.6699 (𝑠 > 0)
70 18 1 1260 𝑠 ·𝑠
100 60620 Esto indica, según la tabla de Guilford, que la correlación
es alta y directa.
𝑬𝑪𝑴 = 𝑠 (1 − 𝑅 ) = 6.4576(1 − 0.4488) = 3.5594

También podría gustarte