Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CODIGO: 305
SEMANA: 13
HUANCAYO – PERÚ
2020
MÉTODO DE MÍNIMOS CUADRADOS
Este método establece que la mejor línea (curva o recta) posible es aquella que
minimiza la suma de los cuadrados de las desviaciones de los puntos dados Yi y los
correspondientes a dicha línea (curva o recta) Yc.
expresión:
. . 𝐷 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌𝑐 )2 = 𝑚𝑖𝑛𝑖𝑚𝑜
. .
. .
𝐷 = ∑(𝑌𝑖 − 𝑌𝑐 )2
𝑖=1
n=número de datos
remplazando Yc=a+bX en D:
𝐷 = ∑(𝑌𝑖 − 𝑌𝑐)2
𝐷 = ∑[𝑌𝑖 − (𝑎 + 𝑏𝑥)]2
𝐷 = ∑(𝑌𝑖 − 𝑎 − 𝑏𝑥)2
∑𝐷2 = mínimo
De modo que:
𝐷 = ∑(𝑌 − 𝑎 − 𝑏𝑥)2
Como debe satisfacer la condición de que las sumas de los cuadrados de las
desviaciones sean mínimos, es decir D sea mínimo, esto solo ocurre cuando:
𝑑𝐷 𝑑𝐷
=0 =0
𝑑𝑎 𝑑𝑏
𝑑𝐷 𝑑(𝑦−𝑎−𝑏𝑥)2
01. = =0
𝑑𝑎 𝑑𝑎
𝑦 − 𝑎 − 𝑏𝑥 = 0
∑(𝑦 − 𝑎 − 𝑏𝑥 ) = 0
∑ 𝑦 = 𝑎𝑛 + 𝑏 ∑ 𝑥
𝑑𝐷 𝑑(𝑦−𝑎−𝑏𝑥)2
02. 𝑑𝑏 = =0
𝑑𝑏
𝑥(𝑦 − 𝑎 − 𝑏𝑥) = 0
(𝑥𝑦 − 𝑎𝑥 − 𝑏𝑥 2 ) = 0
∑(𝑥𝑦 − 𝑎𝑥 − 𝑏𝑥 2 ) = 0
∑ 𝑥𝑦 = 𝑎 ∑ 𝑥 + 𝑏 ∑ 𝑥 2
Las ecuaciones 01 y 02 constituyen las dos ecuaciones normales con dos incógnitas a y
b que son los parámetros definidos como:
a= constante de intersección
b= coeficiente de regresión
Entonces el sistema de ecuaciones normales será:
∑ 𝑦 = 𝑎𝑛 + 𝑏 ∑ 𝑥
∑ 𝑥𝑦 = 𝑎 ∑ 𝑥 + 𝑏 ∑ 𝑥 2
∑ 𝑦 ∑ 𝑥 2 − ∑ 𝑥 ∑ 𝑥𝑦
𝑎= 2
𝑛 ∑ 𝑥 2 − (∑ 𝑥)
𝑛 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑏= 2
𝑛 ∑ 𝑥 2 − (∑ 𝑥)
CARACTERISTICAS DEL COEFICIENTE DE REGRESION
El coeficiente de regresión b indica el número de unidades en el que varía Y al variar X
en una unidad.
Problema
Edad: 48, 40, 30, 39, 46, 42, 27, 36, 34, 46, 32, 42, 40, 32, 27
Tiempo efectivo de trabajo: 24, 18, 9, 14, 22, 22, 4, 13, 10, 20, 12, 18, 16, 8,6
∑X ∑Y ∑XY ∑X2 ∑Y2
48 24 1152 2304 576
40 18 720 1600 324
30 9 270 900 81
39 14 546 1521 196
46 22 1012 2116 484
42 22 924 1764 484
27 4 108 729 16
36 13 468 1296 169
34 10 340 1156 100
46 20 920 2116 400
32 12 384 1024 244
42 18 756 1764 324
40 16 640 1600 256
32 8 250 1024 64
27 6 162 729 36
561 216 8658 21643 3654
Tabla 1: Edad y tiempo efectivo de trabajo
De donde se obtiene:
a = - 18. 363
b = 0.876
Y=a+bX
Y = - 18.363 + 0.876 X
𝑌𝑐 = 23.685 ≈ 24
X = 40 Y = - 18.363 + 0.876 (40)
𝑌𝑐 = 16.677
…………
𝑌𝑐 = 5.289 ≈ 5
Y
. P1 (48, 24)
. P15 (27, 5)
X
2
𝑆𝑦𝑥 = (∑𝑌 2 – a ∑Y – b ∑XY) / n
El valor de la desviación estándar del valor estimado indica que tan dispersos están
los datos en promedio alrededor de la línea de regresión.
ANALISIS DE LA CORRELACION
Por medio de la correlación se puede estudiar el grado de asociación que existe entre
dos variables, mientras que el coeficiente de correlación mide la mutua asociación
entre las variables, el coeficiente de regresión nos dice si alteramos el valor de la
variable independiente, la variable dependiente será alterada.
Sin embargo, cuando dos características están relacionadas, sin que se pueda decir que
una depende de la otra, sino ambas dependen de un factor ajeno a ellas, es necesario
el estudio de la correlación.
Y
y
e [.
YC
-y
X
x
Yc = valor estimado