Está en la página 1de 13

“UNIVERSIDAD NACIONAL DE TUMBES”

“FACULTAD DE CIENCIAS AGRARIAS”

“ESCUELA DE AGROINDUSTRIAS”

ANÁLISIS DE REGRESIÓN I CORRELACIÓN MÚLTIPLE

Estudiantes:

Delgado Balladares yancarlos

Tumbes – 2018
INTRODUCCIÓN

Con frecuencia hemos observado la relación que existe entre una variable y otra
(correlación bivarible) lo cual nos permite, en algunos casos, predecir los valores
de una variable a partir de los valores observados en la otra. Por ejemplo: se ha
encontrado que las calificaciones que un estudiante obtiene en una prueba de
ingreso a la universidad se correlacionan con las calificaciones que el alumno
obtiene en su programa académico; siendo así se podría intentar predecir la
calificación final del estudiante. Pero el mundo de la educación es muy complejo
y difícilmente podemos atribuir a una sola variable los resultados en otra; la
realidad nos obliga a reconocer que para predecir con mayor precisión las
calificaciones finales del estudiante, es necesario observar e integrar en la
predicción otras variables que también puedan estar relacionadas. Un esfuerzo
de este tipo implica la observación de más de dos variables al mismo tiempo y
en el caso de una observación correlacional, requiere de un procedimiento que
permita pesar el grado de impacto que cada una de las variables observadas
puede tener sobre los resultados de la predicción. Por ejemplo, sabemos que el
precio de la colegiatura en una institución está determinado por varias variables:
costo de los servicios públicos, renta del local, gastos indirectos, tamaño y
características del personal que labora en la institución, etc. También sabemos
que estas variables antes mencionadas no tienen la misma importancia al
momento de determinar el costo de la colegiatura, por lo que diríamos que hay
que ponderar el impacto que cada una tendría sobre el costo de la colegiatura.
El procedimiento analítico que nos permite determinar cuánto de la variación en
la variable observada está asociado con la variación del conjunto de variables
que pretenden predecirla se denomina: Correlación Múltiple.
REGRESIÓN MÚLTIPLE

El análisis de regresión múltiple es una técnica estadística que consiste en la


extensión del análisis de regresión simple a una forma donde se aplican dos o
más variables independientes; X1, X2,…, Xk.; siendo: K>=2, para pronosticar el
valor de la variable dependiente Y.

 La estimación de la ecuación de regresión poblacional es la ecuación de


regresión lineal múltiple muestral.

𝒚 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐

Donde:
 a, b1, b2,…, bk. : Son Coeficientes de Correlación Muestral

Formula de regresión múltiple:

 Para b1:

̅ 𝟏 )(𝒀
[∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿 ̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿
̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿
̅ 𝟐 )(𝒀
̅ )]
𝒃𝟏 = 𝟐 𝟐 𝟐 𝟐
[∑ 𝒙𝟏 − 𝒏(𝑿̅𝟏 ) ][∑ 𝒙𝟐 − 𝒏(𝑿̅𝟐 ) ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐

 Para b2:

[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿̅ 𝟐 )(𝒀̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿


̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿
̅ 𝟏 )(𝒀
̅ )]
𝒃𝟐 = 𝟐 𝟐
[∑ 𝒙𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝒙𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐

 Para a:

̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐
Coeficiente de Correlación Múltiple

El Coeficiente de Correlación Múltiple indica la correlación entre una de las variables


independientes y la variable dependiente, manteniendo la otra u otras variables
independientes estadísticamente constante.

Formula:

𝑎 ∑ 𝑌 + 𝑏1 ∑ 𝑋1 𝑌 + 𝑏2 ∑ 𝑋2 𝑌 − 𝑛𝑌̅ 2
𝑟=√
∑ 𝑌 2 − 𝑛𝑌̅ 2

Ejercicios

Ejemplo 1.

Se realiza un estudio de asociación entre las variables:

Y: Gastos mensuales expresados en cientos de dólares

X1: Ingreso mensual familiar en miles de dólares

X2: Tamaño de la familia.


En una encuesta de 10 familias escogidas al azar se han encontrado los datos que se
presentan en la tabla:

𝒀 𝑿𝟏 𝑿𝟐 𝑿𝟐𝟏 𝑿𝟐𝟐 𝑿𝟏 ∗ 𝑿𝟐 𝑿𝟏 ∗ 𝒀 𝑿𝟐 ∗ 𝒀 𝒀𝟐
45 10 9 100 81 90 450 405 2025
40 9 8 81 64 72 360 320 1600
38 8 6 64 36 48 304 228 1444
35 7 6 49 36 42 245 210 1225
32 7 5 49 25 35 224 160 1024
30 6 4 36 16 24 180 120 900
28 6 3 36 9 18 168 84 784
27 4 2 16 4 8 108 54 729
25 3 2 9 4 6 75 50 625
22 2 1 4 1 2 44 22 484
∑ 𝒀 = 𝟑𝟐𝟐 ∑ 𝑿𝟏 = 𝟔𝟐 ∑ 𝑿𝟐 = 𝟒𝟔
∑ 𝑿𝟐𝟏 ∑ 𝑿𝟐𝟐 ∑ 𝑿𝟏 𝑿𝟐 ∑ 𝑿𝟏 𝒀 ∑ 𝑿𝟐 𝒀 ∑ 𝒀𝟐
̅ = 𝟑𝟐. 𝟐
𝒀 ̅ 𝟏 = 𝟔. 𝟐
𝑿 ̅ 𝟐 = 𝟒. 𝟔
𝑿 = 𝟒𝟒𝟒 = 𝟐𝟕𝟔 = 𝟑𝟒𝟓 = 𝟐𝟏𝟓𝟖 = 𝟏𝟔𝟓𝟑 = 𝟏𝟎𝟖𝟒𝟎
Determinar:

 La ecuación de regresión múltiple muestral


 El coeficiente de Correlación múltiple

Solución:

 Determinando la ecuación de regresión múltiple muestral

𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐

De los datos tenemos

𝒏 = 10; ∑ 𝒀 = 322; ∑ 𝑿𝟏 = 62; ∑ 𝑿𝟐 = 46 ; ∑ 𝑿𝟐𝟏 = 444 ; ∑ 𝑿𝟐𝟐 = 276; ∑ 𝑿𝟏 𝑿𝟐 = 345 ;

̅ = 54.5; 𝑿
∑ 𝑿𝟏 𝒀 = 2158; ∑ 𝑿𝟐 𝒀 = 1653; ∑ 𝒀𝟐 = 10840; 𝒀 ̅ 𝟏 = 49; 𝑿
̅ 𝟐 = 14.83

Empleando la fórmula de regresión múltiple

[∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿 ̅ 𝟏 )(𝒀


̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿
̅ 𝟐 )(𝒀
̅ )]
𝒃𝟏 =
[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐

64.4 ∗ 161.6 − 59.8 ∗ 171.8 133.4


𝒃𝟏 = =
59.6 ∗ 64.4 − 3576 262.2

𝒃𝟏 = 𝟎. 𝟓𝟎𝟗

[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿 ̅ 𝟐 )(𝒀


̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿
̅ 𝟏 )(𝒀
̅ )]
𝒃𝟐 =
[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐

59.6 ∗ 171.8 − 59.8 ∗ 161.6 575.6


𝑏2 = =
59.6 ∗ 64.4 − 3576 262.2

𝒃𝟐 = 𝟐. 𝟏𝟗𝟓

̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐

𝒂 = 𝟑𝟐. 𝟐 − 𝟎. 𝟓𝟎𝟗 ∗ 𝟔. 𝟐 − 𝟐. 𝟏𝟗𝟓 ∗ 𝟒. 𝟔

𝒂 = 𝟏𝟖. 𝟗𝟒𝟕

Reemplazando en la formula de Regresión Y.

𝒀 = 𝟏𝟖. 𝟗𝟒𝟕 + 𝟎. 𝟓𝟎𝟗𝑿𝟏 + 𝟐. 𝟏𝟗𝟓𝑿𝟐


 Determinando el coeficiente de correlación

̅𝟐
𝒂 ∑ 𝒀 + 𝒃𝟏 ∑ 𝑿𝟏 𝒀 + 𝒃𝟐 ∑ 𝑿𝟐 𝒀 − 𝒏𝒀
𝒓=√
∑ 𝒀𝟐 − 𝒏𝒀̅𝟐

18.947 ∗ 322 + 0.509 ∗ 2158 + 2.195 ∗ 1653 − 10 ∗ 32.22


𝑟=√
10840 − 10 ∗ 32.22

6100.934 + 1098.42 + 3628.34 − 10368.4


𝑟= √ ⇒ 𝒓 = 𝟎. 𝟗𝟖𝟔
10840 − 10368.4

Ejercicio desarrollado por sistema de ecuaciones de mínimo cuadrado

Formulas:

𝒏 ∗ 𝒂 + ∑ 𝑿𝟏 𝒃𝟏 + ∑ 𝑿𝟐 𝒃𝟐 = ∑ 𝒀

∑ 𝑿𝟏 𝒂 + ∑ 𝑿𝟐𝟏 𝒃𝟏 + ∑ 𝑿𝟏 𝑿𝟐 𝒃𝟐 = ∑ 𝑿𝟏 𝒀

∑ 𝑿𝟐 𝒂 + ∑ 𝑿𝟏 𝑿𝟐 𝒃𝟏 + ∑ 𝑿𝟐𝟐 𝒃𝟐 = ∑ 𝑿𝟐 𝒀

 𝟏𝟎𝒂 + 𝟔𝟒𝒃𝟏 + 𝟒𝟔𝒃𝟐 = 𝟑𝟐𝟐


 𝟔𝟐𝒂 + 𝟒𝟒𝟒𝒃𝟏 + 𝟑𝟒𝟓𝒃𝟐 = 𝟐𝟏𝟓𝟖
 𝟒𝟔𝒂 + 𝟑𝟒𝟓𝒃𝟏 + 𝟐𝟕𝟔𝒃𝟐 = 𝟏𝟔𝟓𝟑

Método Práctico para convertir el sistema de ecuaciones de 3 a 2 ecuaciones

Formulas:

∑ 𝑋12 𝒃𝟏 + ∑ 𝑋1 𝑋2 𝒃𝟐 = ∑ 𝑿𝟏 𝒀
∑ 𝑋2 𝑋1 𝒃𝟏 + ∑ 𝑋22 𝒃𝟐 = ∑ 𝑿𝟐 𝒀

Donde:

 ̅ 𝟏 )𝟐
𝐒𝒙𝟐𝟏 = ∑ 𝑿𝟐𝟏 − 𝒏(𝑿
 ̅ 𝟐 )𝟐
𝐒𝑿𝟐𝟐 = ∑ 𝑿𝟐𝟐 − 𝒏(𝑿
 𝐒𝑿𝟏 𝑿𝟐 = ∑ 𝑿𝟏 𝑿𝟐 − 𝒏( 𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐)
 𝐒𝑿𝟏 𝒀 = ∑ 𝑿𝟏 𝒀 − 𝒏( 𝑿 ̅ 𝟏 )(𝒀
̅)
 𝐒𝑿𝟐 𝒀 = ∑ 𝑿𝟐 𝒀 − 𝒏( 𝑿 ̅ 𝟐 )(𝒀
̅)

Reemplazando Los valores:


 𝟒𝟒𝟒 − 𝟏𝟎 ∗ 𝟔. 𝟐𝟐 = 𝟓𝟗. 𝟔
 𝟐𝟕𝟔 − 𝟏𝟎 ∗ 𝟒. 𝟔𝟐 = 𝟔𝟒. 𝟒
 𝟑𝟒𝟓 − 𝟏𝟎 ∗ 𝟔. 𝟐 ∗ 𝟒. 𝟔 = 𝟓𝟗. 𝟖
 𝟐𝟏𝟓𝟖 − 𝟏𝟎 ∗ 𝟔. 𝟐 ∗ 𝟑𝟐. 𝟐 = 𝟏𝟔𝟏. 𝟔
 𝟏𝟔𝟓𝟑 − 𝟏𝟎 ∗ 𝟒. 𝟔 ∗ 𝟑𝟐. 𝟐 = 𝟏𝟕𝟏. 𝟖

Sistema de 2 ecuaciones:

𝟓𝟗. 𝟔𝒃𝟏 + 𝟓𝟗. 𝟖𝒃𝟐 = 𝟏𝟔𝟏. 𝟔 …. (1)


-59.8/59.6
𝟓𝟗. 𝟖𝒃𝟏 + 𝟔𝟒. 𝟒𝒃𝟐 = 𝟏𝟕𝟏. 𝟖 …. (2)

−𝟓𝟗. 𝟖𝒃𝟏 + 𝟔𝟎. 𝟎𝟎𝟏𝒃𝟐 = −𝟏𝟔𝟐. 𝟏𝟒

𝟓𝟗. 𝟖𝒃𝟏 + 𝟔𝟒. 𝟒𝒃𝟐 = 𝟏𝟕𝟏. 𝟖

𝟒. 𝟑𝟗𝟗𝒃𝟐 = 𝟗. 𝟔𝟔

𝒃𝟐 = 𝟐. 𝟏𝟗𝟓

Reemplazando en (1)

𝟓𝟗. 𝟔𝒃𝟏 + 𝟏𝟑𝟏. 𝟐𝟔 = 𝟏𝟔𝟏. 𝟔

𝟓𝟗. 𝟔𝒃𝟏 = 𝟑𝟎. 𝟑𝟒

𝒃𝟏 = 𝟎. 𝟓𝟎𝟗

Para Obtener (a)

̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐

𝒂 = 𝟑𝟐. 𝟐 − 𝟎. 𝟓𝟎𝟗 ∗ 𝟔. 𝟐 − 𝟐. 𝟏𝟗𝟓 ∗ 𝟒. 𝟔


𝒂 = 𝟏𝟖. 𝟗𝟒𝟕

∴ 𝒀 = 𝟏𝟖. 𝟗𝟒𝟕 + 𝟎. 𝟓𝟎𝟗𝑿𝟏 + 𝟐. 𝟏𝟗𝟓𝑿𝟐

Sistema de regresión múltiple muestral

Ejemplo 2

El departamento de producción de una fábrica de confecciones textiles desea explorar


la relación entre el número de operadores (𝑿𝟐 ) que hacen pantalones, la edad
promedio de ellos (𝑿𝟏 ), y la cantidad producida por semana (𝒀); una muestra aleatoria
para realizar el estudio reveló los siguientes datos:
𝑌 𝑋1 𝑋2 𝑋12 𝑋22 𝑋1 𝑋2 𝑋1 𝑌 𝑋2 𝑌 𝑌2
30 28 10 784 100 280 840 300 900
45 43 12 1849 144 516 1935 540 2025
52 48 14 2304 196 672 2496 728 2704
55 52 15 2704 225 780 2860 825 3025
70 60 17 3600 289 1020 4200 1190 4900
75 63 21 3969 441 1323 4725 1575 5625
∑ 𝑌 = 327 ∑ 𝑋1 = 294 ∑ 𝑋2 = 89 ∑ 𝑋12 ∑ 𝑋22 ∑ 𝑋1 𝑋2 ∑ 𝑋1 𝑌 ∑ 𝑋2 𝑌 ∑ 𝑌2
𝑌̅ = 54.5 𝑋̅1 = 49 𝑋̅2 = 14.83 = 15210 = 1395 = 4591 = 17056 = 5158 = 19179

a) Determinar la ecuación de regresión múltiple muestral


b) Determine el coeficiente de correlación múltiple

Solución:

 Determinando la ecuación de regresión múltiple muestral

𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐

De los datos tenemos

𝒏 = 𝟔; ∑ 𝒀 = 327; ∑ 𝑿𝟏 = 294; ∑ 𝑿𝟐 = 89 ; ∑ 𝑿𝟐𝟏 = 15210 ; ∑ 𝑿𝟐𝟐 = 1395;

̅ = 54.5; 𝑿
∑ 𝑿𝟏 𝑿𝟐 = 4591 ; ∑ 𝑿𝟏 𝒀 = 17056; ∑ 𝑿𝟐 𝒀 = 5158; ∑ 𝒀𝟐 = 19179; 𝒀 ̅ 𝟏 = 49; 𝑿
̅ 𝟐 = 14.83

Empleando la formula de regresión múltiple

[∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿 ̅ 𝟏 )(𝒀


̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿
̅ 𝟐 )(𝒀
̅ )]
𝒃𝟏 =
[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐

[1395 − 6(14.83)2 ][17056 − 6 ∗ 49 ∗ 5435] − [4591 − 6 ∗ 49 ∗ 14.83][5158 − 6 ∗ 14.83 ∗ 54.5]


𝒃𝟏 =
[15210 − 6(49)2 ][1395 − 6(14.83)2 ] − [4591 − 6 ∗ 49 ∗ 14.83]2
𝟔𝟔𝟑𝟕. 𝟗𝟕
𝒃𝟏 =
𝟕𝟐𝟗𝟏. 𝟓𝟒𝟖

𝒃𝟏 = 𝟎. 𝟗

[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿 ̅ 𝟐 )(𝒀


̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿
̅ 𝟏 )(𝒀
̅ )]
𝒃𝟐 =
[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐

[15210 − 6 ∗ 492 ][5158 − 6 ∗ 14.83 ∗ 54.5] − [4591 − 6 ∗ 49 ∗ 14.83][17056 − 6 ∗ 49 ∗ 54.5]


𝒃𝟐 =
[15210 − 6(49)2 ][1395 − 6(14.83)2 ] − [4591 − 6 ∗ 49 ∗ 14.83]2

[𝟖𝟎𝟒 ∗ 𝟑𝟎𝟖. 𝟓𝟗] − [𝟐𝟑𝟎. 𝟗𝟖 ∗ 𝟏𝟎𝟑𝟑] 𝟗𝟓𝟎𝟒. 𝟎𝟐


𝒃𝟐 = ⟹ 𝒃𝟐 =
𝟖𝟎𝟒 ∗ 𝟕𝟓. 𝟒𝟐𝟕 − 𝟓𝟑𝟑𝟓𝟏. 𝟕𝟔 𝟕𝟐𝟗𝟏. 𝟓𝟒𝟖

𝒃𝟐 = 𝟏. 𝟑𝟎

̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐

𝒂 = 𝟓𝟒. 𝟓 − 𝟎. 𝟗 ∗ 𝟒𝟗 − 𝟏. 𝟑𝟎 ∗ 𝟏𝟒𝟗𝟖

𝒂 = −𝟖. 𝟖𝟕𝟗

Reemplazando en la formula de Regresión Y.

𝒀 = −𝟖. 𝟖𝟕𝟗 + 𝟎. 𝟗𝑿𝟏 + 𝟏. 𝟑𝟎𝑿𝟐

 Determinando el coeficiente de correlación

̅𝟐
𝒂 ∑ 𝒀 + 𝒃𝟏 ∑ 𝑿𝟏 𝒀 + 𝒃𝟐 ∑ 𝑿𝟐 𝒀 − 𝒏𝒀
𝒓=√
∑ 𝒀𝟐 − 𝒏𝒀̅𝟐

−8.879 ∗ 327 + 0.9 ∗ 17056 + 1.30 ∗ 5158 − 6 ∗ 54.52


𝑟=√
19179 − 6 ∗ 54.52

−2903.43 + 15350.4 + 6705.4 − 17821.5


𝑟= √
19179 − 17821.5

1330.87
𝑟= √ ⟹ 𝒓 = √𝟎. 𝟗𝟖 = 𝟎. 𝟗𝟗
1357.5

 Desarrollando por ecuaciones de mínimo cuadrado

𝒏 ∗ 𝒂 + ∑ 𝑿 𝟏 𝒃𝟏 + ∑ 𝑿 𝟐 𝒃𝟐 = ∑ 𝒀

∑ 𝑿𝟏 𝒂 + ∑ 𝑿𝟐𝟏 𝒃𝟏 + ∑ 𝑿𝟏 𝑿𝟐 𝒃𝟐 = ∑ 𝑿𝟏 𝒀

∑ 𝑿𝟐 𝒂 + ∑ 𝑿𝟏 𝑿𝟐 𝒃𝟏 + ∑ 𝑿𝟐𝟐 𝒃𝟐 = ∑ 𝑿𝟐 𝒀
 𝟔𝒂 + 𝟐𝟗𝟒𝒃𝟏 + 𝟖𝟗𝒃𝟐 = 𝟑𝟐𝟕
 𝟐𝟗𝟒𝒂 + 𝟏𝟓𝟐𝟏𝟎𝒃𝟏 + 𝟒𝟓𝟗𝟏𝒃𝟐 = 𝟏𝟕𝟎𝟓𝟔
 𝟖𝟗𝒂 + 𝟒𝟓𝟗𝟏𝒃𝟏 + 𝟏𝟑𝟗𝟓𝒃𝟐 = 𝟓𝟏𝟓𝟖

Método practico para convertir el sistema de ecuaciones de 3 a 2 ecuaciones

∑ 𝑋12 𝒃𝟏 + ∑ 𝑋1 𝑋2 𝒃𝟐 = ∑ 𝑿𝟏 𝒀

∑ 𝑋2 𝑋1 𝒃𝟏 + ∑ 𝑋22 𝒃𝟐 = ∑ 𝑿𝟐 𝒀

Donde:

 ̅ 𝟏 )𝟐
𝐒𝒙𝟐𝟏 = ∑ 𝑿𝟐𝟏 − 𝒏(𝑿
𝟐
 𝐒𝑿𝟐𝟐 = ∑ 𝑿𝟐𝟐 − 𝒏(𝑿
̅ 𝟐)
 𝐒𝑿𝟏 𝑿𝟐 = ∑ 𝑿𝟏 𝑿𝟐 − 𝒏( 𝑿̅ 𝟏 )(𝑿
̅ 𝟐)
 ̅ 𝟏 )(𝒀
𝐒𝑿𝟏 𝒀 = ∑ 𝑿𝟏 𝒀 − 𝒏( 𝑿 ̅)
 ̅ 𝟐 )(𝒀
𝐒𝑿𝟐 𝒀 = ∑ 𝑿𝟐 𝒀 − 𝒏( 𝑿 ̅)
Reemplazando Los valores:
 𝟏𝟓𝟐𝟏𝟎 − 𝟔 ∗ 𝟒𝟗𝟐 = 𝟖𝟎𝟒
 𝟏𝟑𝟗𝟓 − 𝟔 ∗ 𝟏𝟒. 𝟖𝟑𝟐 = 𝟕𝟓. 𝟒𝟐𝟔
 𝟒𝟓𝟗𝟏 − 𝟔 ∗ 𝟒𝟗 ∗ 𝟏𝟒. 𝟖𝟑 = 𝟐𝟑𝟎. 𝟗𝟖
 𝟏𝟕𝟎𝟓𝟔 − 𝟔 ∗ 𝟒𝟗 ∗ 𝟓𝟒. 𝟓 = 𝟏𝟎𝟑𝟑
 𝟓𝟏𝟓𝟖 − 𝟔 ∗ 𝟏𝟒. 𝟖𝟑 ∗ 𝟓𝟒. 𝟓 = 𝟑𝟎𝟖. 𝟓𝟗

Sistema de 2 ecuaciones:

𝟖𝟎𝟒𝒃𝟏 + 𝟐𝟑𝟎. 𝟗𝟖𝒃𝟐 = 𝟏𝟎𝟑𝟑 …. (1)


-230.98/804
𝟐𝟑𝟎. 𝟗𝟖𝒃𝟏 + 𝟕𝟓. 𝟒𝟐𝟔𝒃𝟐 = 𝟑𝟎𝟖. 𝟓𝟗 …. (2)

−𝟐𝟑𝟎. 𝟗𝟖𝒃𝟏 − 𝟔𝟔. 𝟑𝟓𝟕𝒃𝟐 = −𝟐𝟗𝟔. 𝟕𝟔𝟗

𝟐𝟑𝟎. 𝟗𝟖𝒃𝟏 + 𝟕𝟓. 𝟒𝟐𝟔𝒃𝟐 = 𝟑𝟎𝟖. 𝟓𝟗

𝟗. 𝟎𝟔𝟖𝒃𝟐 = 𝟏𝟏. 𝟖𝟐𝟏

𝒃𝟐 = 𝟏. 𝟑𝟎

Reemplazando en (1)

𝟖𝟎𝟒𝒃𝟏 + 𝟐𝟑𝟎. 𝟗𝟖𝒃𝟐 = 𝟏𝟎𝟑𝟑

𝟖𝟎𝟒𝒃𝟏 = 𝟐𝟑𝟎. 𝟗𝟖(𝟏. 𝟑𝟎) = 𝟏𝟎𝟑𝟑

𝒃𝟏 = 𝟎. 𝟗

Para Obtener (a)


̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐
𝒂 = 𝟓𝟒. 𝟓 − 𝟎. 𝟗 ∗ 𝟒𝟗 − 𝟏. 𝟑𝟎 ∗ 𝟏𝟒. 𝟖𝟑 = −𝟖. 𝟖𝟕𝟗 ∴ 𝒀 = −𝟖. 𝟖𝟕𝟗 + 𝟎. 𝟗𝑿𝟏 + 𝟏. 𝟑𝟎𝑿𝟐

Ejemplo 3

El gerente de ventas de las llantas “GOOD BYE” que se venden en todo el país realiza
un estudio para determinar la relación entre el numero de llantas vendidas por mes (Y
en cientos) y los gastos de publicidad mensuales (en cientos de dólares), X1: Radio,
X2: Periódicos. Los datos obtenidos en una muestra de 5 provincias se dan en la tabla
que sigue:

𝒀 𝑿𝟏 𝑿𝟐 𝑿𝟐𝟏 𝑿𝟐𝟐 𝑿𝟏 𝑿𝟐 𝑿𝟏 𝒀 𝑿𝟐 𝒀 𝒀𝟐
4 13 15 169 225 195 52 60 16
5 12 16 144 256 192 60 80 25
5 15 18 225 324 270 75 90 25
6 14 17 196 289 238 84 102 36
7 16 17 256 289 272 112 119 49
∑ 𝒀 = 𝟐𝟕 ∑ 𝑿𝟏 = 𝟕𝟎 ∑ 𝑿𝟐 = 𝟖𝟑 ∑ 𝑿𝟐𝟏 ∑ 𝑿𝟐𝟐 ∑ 𝑿𝟏 𝑿𝟐 ∑ 𝑿𝟏 𝒀 ∑ 𝑿𝟐 𝒀 ∑ 𝒀𝟐
̅ = 𝟓. 𝟒
𝒀 ̅ 𝟏 = 𝟏𝟒
𝑿 ̅ 𝟐 = 𝟏𝟔. 𝟔
𝑿 = 𝟗𝟗𝟎 = 𝟏𝟑𝟖𝟑 = 𝟏𝟏𝟔𝟕 = 𝟑𝟖𝟑 = 𝟒𝟓𝟏 = 𝟏𝟓𝟏
a) Determinar la ecuación de regresión muestral de Y en X1, X2.
b) Hallar el coeficiente de Correlación

Solución:

 Determinando la ecuación de regresión múltiple muestral

𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐

De los datos tenemos

𝒏 = 𝟓; ∑ 𝒀 = 27; ∑ 𝑿𝟏 = 70; ∑ 𝑿𝟐 = 83 ; ∑ 𝑿𝟐𝟏 = 990 ; ∑ 𝑿𝟐𝟐 = 1383;

̅ = 5.4; 𝑿
∑ 𝑿𝟏 𝑿𝟐 = 1167 ; ∑ 𝑿𝟏 𝒀 = 383; ∑ 𝑿𝟐 𝒀 = 451; ∑ 𝒀𝟐 = 151; 𝒀 ̅ 𝟏 = 𝟏4; 𝑿
̅ 𝟐 = 16.6

Empleando la formula de regresión múltiple

[∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿 ̅ 𝟏 )(𝒀


̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿
̅ 𝟐 )(𝒀
̅ )]
𝒃𝟏 =
[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐

[1383 − 5(16.6)2 ][383 − 5 ∗ 14 ∗ 5.4] − [1167 − 5 ∗ 14 ∗ 16.6][451 − 5 ∗ 16.6 ∗ 5.4]


𝒃𝟏 =
[990 − 5(14)2 ][1383 − 5(16.6)2 ] − [1167 − 5 ∗ 14 ∗ 16.6]2

𝟓. 𝟐 ∗ 𝟓 − 𝟓 ∗ 𝟐. 𝟖 𝟐𝟔 − 𝟏𝟒
𝒃𝟏 = = = 𝒃𝟏 = 𝟎. 𝟒𝟒
𝟏𝟎 ∗ 𝟓. 𝟐 − 𝟐𝟓 𝟐𝟕
̅ 𝟐 )(𝒀
[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿 ̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿
̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿
̅ 𝟏 )(𝒀
̅ )]
𝒃𝟐 = 𝟐 𝟐 𝟐 𝟐
[∑ 𝒙𝟏 − 𝒏(𝑿̅𝟏 ) ][∑ 𝒙𝟐 − 𝒏(𝑿̅𝟐 ) ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐

[990 − 5 ∗ 142 ][451 − 5 ∗ 16.6 ∗ 5.4] − [1167 − 5 ∗ 14 ∗ 16.6][383 − 5 ∗ 14 ∗ 5.4]


𝒃𝟐 =
[990 − 5(14)2 ][1383 − 5(16.6)2 ] − [1167 − 5 ∗ 14 ∗ 16.6]2

[𝟏𝟎 ∗ 𝟐. 𝟖] − [𝟓 ∗ 𝟓] 𝟐𝟖 − 𝟐𝟓
𝒃𝟐 = ⟹ 𝒃𝟐 =
𝟏𝟎 ∗ 𝟓. 𝟐 − 𝟐𝟓 𝟐𝟕

𝒃𝟐 = 𝟎. 𝟏𝟏

̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐

𝒂 = 𝟓. 𝟒 − 𝟎. 𝟒𝟒 ∗ 𝟏𝟒 − 𝟎. 𝟏𝟏 ∗ 𝟏𝟔. 𝟔

𝒂 = −𝟐. 𝟓𝟖𝟔

Reemplazando en la formula de Regresión Y.

𝒀 = −𝟐. 𝟓𝟖𝟔 + 𝟎. 𝑿𝟏 + 𝟎. 𝟏𝟏𝑿𝟐

 Determinando el coeficiente de correlación

̅𝟐
𝒂 ∑ 𝒀 + 𝒃𝟏 ∑ 𝑿𝟏 𝒀 + 𝒃𝟐 ∑ 𝑿𝟐 𝒀 − 𝒏𝒀
𝒓=√
∑ 𝒀𝟐 − 𝒏𝒀̅𝟐

−2.586 ∗ 27 + 0.44 ∗ 383 + 0.11 ∗ 451 − 5 ∗ 5.42


𝑟=√
151 − 5 ∗ 5.42

2.508
𝑟= √
5.2

⟹ 𝒓 = 𝟎. 𝟔𝟗
Referencias bibliográficas

Sifuentes, V.2002. Curso Análisis Multivariante aplicado a la industria pesquera.


IMARPE.
Daniel, W. 2006. Bioestadística. Base para el análisis de las ciencias de la salud
4ta Edic. Edit Limusa Wiley. 924 p
Little T y Hills, J. 1990. Métodos estadísticos para la investigación en la agricultura.
Edit Trillas. 270 pp.
Ross,S. 2002. Probabilidad y estadística para ingenieros. Ed Mc Graw Hill. 585 pp.

También podría gustarte