Está en la página 1de 22

ANALISIS BIDIMENSIONAL

REGRESION: Consiste en determinar una relación funcional


(Recta de Regresión) entre las variables X e Y
𝑌 = 𝑓(𝑋)

Donde la variable que se va a predecir se llama variable


dependiente y la variable que es la base de la predicción se
denomina variable independiente.

CORRELACIÓN: Consiste en determinar la variación


conjunta de las variables X e Y, su grado de relación y su
sentido (+ o - )
DIAGRAMA DE DISPERSIÓN
COEFICIENTE DE CORRELACIÓN DE PEARSON
𝐶𝑜𝑣 ( 𝑋 , 𝑌)
𝑟=
𝑆𝑥 𝑆𝑦

Si r = 1, correlación perfecta positiva


Si r = -1, correlación perfecta negativa
Si r = 0, no existe correlación

Donde 𝐶𝑜𝑣 ( 𝑋 , 𝑌) es la
covarianza que mide el
grado de dispersión o
variabilidad conjunta de las
dos variables X e Y.

σ 𝑋𝑌
𝐶𝑜𝑣 = − 𝑋ത 𝑌ത
𝑛
Las varianzas respecto a x e y son
respectivamente:
2
σ 𝑋𝑖
𝑆𝑥2 = − 𝑋ത 2
𝑛
2
σ 𝑌𝑖
𝑆𝑌2 = − 𝑌ത 2
𝑛

𝐶𝑂𝑉 𝑋, 𝑌 > 0, ambas variables varían en el mismo


sentido.

𝐶𝑂𝑉 𝑋, 𝑌 < 0, ambas variables varían en sentidos


opuestos.

𝐶𝑂𝑉 𝑋, 𝑌 = 0, la varianza de X no tiene efecto sobre


Y.
LA VARIANZA RESIDUAL

La diferencia entre 𝑦 = 𝑎 + 𝑏𝑥 y su respectivo “Y” observado se


2
representa por 𝑆𝑦𝑥 , estos valores son estimaciones de la variabilidad de
“Y” con respecto a la línea de regresión.

Su ecuación es:

2 1 σ𝑦 2 σ𝑥σ𝑦
𝑆𝑦𝑥 = [ σ 𝑦2 − − 𝑏(σ 𝑥𝑦 − )]
𝑛−2 𝑛 𝑛
ANALISIS DE REGRESION LINEAL SIMPLE

Y = a + bx
INTERPRETACION DEL COEFICIENTE “b”
El coeficiente “b” es la pendiente o el coeficiente de la regresión
lineal.
• Si 𝑏 > 0, entonces la tendencia lineal es creciente, es decir a
mayores valores de x corresponden mayores valores de y, también
a menores valores de x corresponden menores valores de y.

• Si 𝑏 < 0, entonces la tendencia lineal es decreciente, es decir a


mayores valores de x corresponden menores valores de y; también
a menores valores de x corresponden mayores valores de y.

• Si 𝑏 = 0, entonces y=a. Luego y permanece estacionario para


cualquier valor de x, entonces no hay regresión.
DEFINICIÓN: Se denomina error o residuo a cada diferencia
𝑑𝑖 = 𝑦𝑖 − 𝑦ො𝑖 un método para determinar la recta que mejor se ajuste a
los n datos de la muestra (𝑥𝑖 , 𝒚𝒊 ) es el Método de los Mínimos
Cuadrados.

La recta de regresión de los mínimos cuadrados de y en x es aquella que


hace mínima la suma de los cuadrados de los errores cuya expresión es:

෍ 𝑑𝑖2 = 0

෍(𝑦𝑖 − 𝑦ො𝑖 )2 = 0

෍(𝑦𝑖 − 𝑎 + 𝑏𝑥𝑖 )2 = 0
METODO DE LOS MINIMOS CUADRADOS

El método de los Mínimos Cuadrados consiste en hallar la recta


𝑦 = 𝑎 + 𝑏𝑥, de tal manera que la suma de los cuadrados de
las diferencias de las ordenadas y los puntos sobre la recta L
sea mínima.

𝑎 = 𝑦ത − 𝑏𝑥ҧ

𝑛 σ 𝑥𝑦 − σ 𝑥 σ 𝑦
𝑏= 2
𝑛 σ 𝑥 2 − (σ 𝑥)

𝐶𝑂𝑉(𝑋, 𝑌)
𝑏=
𝑆𝑋2
También se puede aplicar :
𝐶𝑜𝑣(𝑥,𝑦)
𝑌 − 𝑌ത = 𝑆𝑥2
( X - 𝑋ത )

El coeficiente de determinación (𝑟 2 ), cuanto


mayor sea el valor de este coeficiente mejor
será el ajuste y más útil la recta de regresión,
por ejemplo: si 𝑟 2 = 0.90 𝑖𝑛𝑑𝑖𝑐𝑎 que de
100 pares de puntos 90 están en la recta de
regresión
EJERCICIO 1: La información estadística obtenida de una muestra de tamaño 12
sobre la relación existente entre la inversión realizada y el rendimiento obtenido en
cientos de miles de soles para inversión en un centro de salud, se muestra en el
siguiente cuadro: Inversión (X), Rendimiento (Y)

X 11 14 16 15 16 18 20 21 14 20 19 11
Y 2 3 5 6 5 3 7 10 6 10 5 6

Calcular:
a) La recta de regresión del rendimiento respecto de la inversión.
b) La previsión de inversión que se obtendrá con un rendimiento de
1250 000 soles.
c) Determinar el coeficiente de correlación.
d) Determinar el coeficiente de determinación.
X 11 14 16 15 16 18 20 21 14 20 19 11
Y 2 3 5 6 5 3 7 10 6 10 5 6
SOLUCION

a)
𝑿𝒊 𝒀𝒊 𝑿𝒊 𝒀𝒊 𝑿𝟐𝒊 𝒀𝟐𝒊
195 68 1163 3297 454

σ 𝑋𝑖2
𝑆𝑥2 = − 𝑋ത 2 = 𝑆𝑥 =
𝑛

σ 𝑌𝑖2 𝑆𝑦 =
𝑆𝑌2 = ത2
−𝑌 =
𝑛

𝑋ത =

𝑌ത =

σ 𝑋𝑌
𝐶𝑜𝑣 = − 𝑋ത 𝑌=

𝑛
b) 𝐶𝑜𝑣 𝑥, 𝑦
𝑥 − 𝑥ҧ = (𝑦 − 𝑦)

𝑆𝑦2

c)
𝐶𝑜𝑣 ( 𝑋 , 𝑌)
𝑟=
𝑆𝑥 𝑆𝑦

d)
EJERCICIO 2:

b) Hallar la ecuación de la recta de regresión lineal


c) Interpretar el coeficiente de correlación lineal
DIAGRAMA DE DISPERSION
b)
𝑿𝒊 𝒀𝒊 𝑿𝒊 𝒀𝒊 𝑿𝟐𝒊 𝒀𝟐𝒊
63 83 620 549 887

σ 𝑋𝑖2 σ 𝑋𝑌
𝑆𝑥2 = − 𝑋ത 2 = 𝐶𝑜𝑣 = − 𝑋ത 𝑌=

𝑛
𝑛

𝐶𝑜𝑣 =
𝑆𝑥 =

σ 𝑌𝑖2
𝑆𝑌2 = 𝑛
− 𝑌ത 2 = 𝐶𝑜𝑣(𝑥,𝑦)
𝑌 − 𝑌ത = ( X - 𝑋ത )
𝑆𝑥2

𝑆𝑦 =

𝑋ത =

𝑌ത =
c)
𝐶𝑜𝑣 ( 𝑋 ,𝑌)
𝑟= 𝑆𝑥 𝑆𝑦
EJERCICIO 3: Se desea estudiar la relación que existe entre el número de
horas que dedican al estudio (X) y el porcentaje que obtienen en el examen
(Y). Para ello se tomó una muestra de 7 elementos:

X 1 5 2 6 8 7 4

Y 32 85 45 80 90 85 60

a) Realizar un diagrama de dispersión.


b) Estimar la línea de regresión más adecuada.
c) Hallar el coeficiente de correlación.
Y

X
𝑿𝒊 𝒀𝒊 𝑿𝒊 𝒀𝒊 𝑿𝟐𝒊 𝒀𝟐𝒊
33 477 2582 195 35599

También podría gustarte