Está en la página 1de 3

ANALISIS DE REGRESION

El objetivo principal en un análisis de regresión es establecer una relación cuantitativa entre


variables en estudio expresada a través de ecuaciones matemáticas que expliquen el
comportamiento entre las variables en cuestión. Si el estudio abarca tan solo a dos variables
entonces se habla de un análisis de regresión simple, si abarcara a más de dos variables se habla
de un análisis de regresión múltiple. En este curso nos limitaremos a un análisis de regresión
simple

ANALISIS DE REGRESION SIMPLE

Lo primero que se hace es una vez que se tienen la información bivariada en las variables X e Y se
representan en un plano cartesiano. La representación de estos puntos es conocido como un
diagrama de dispersión también llamado nube de puntos y se trata de encontrar la curva que al
proyectarla se ajuste mejor a esta nube de puntos, si la curva a trazar es una línea recta hablamos
de un análisis de regresión lineal simple

La mejor recta de ajuste se obtiene a través del método de los mínimos cuadrados que consiste en
minimizar la suma de las distancias de los puntos que entrega la recta con los puntos reales.

La recta de regresión viene dada por: ^y =a+bx donde a y b son llamados los coeficientes de
regresión, valores que se obtienen al resolver el sistema de ecuaciones siguientes conocido como
las ecuaciones normales:
n n

∑ yi =na+b ∑ x i
i=1 i=1

n n n

∑ x i ∙ y i=a ∙ ∑ x i +b ∑ x 2i
i=1 i=1 i=1

Otra forma de encontrar los coeficientes de regresión es usando las fórmulas siguientes:

COV (X , Y )
b= ; Y a=Ý −b ∙ X́
σ 2X

EJEMPLO: Determine la recta de mejor ajuste a la información siguiente

SUMA PROMEDIO

X 1 3 2 4 5 15 3
Y 2 6 1 3 8 20 4

COV ( X , Y )
SOLUCION: Debemos encontrar la recta: Y
^ =a+b ∙ X siendo b= y a=Ý −b ∙ X́
σ 2X

Construimos las filas siguientes entonces:


SUMA PROMEDIO

X ∙Y 2 18 2 12 40 74 14,8
X2 1 9 4 16 25 55 11

´ − X́ ∙ Ý
XY 14,8−12
Luego b= = =1,4
2
X́ − X́ 2 11−9

En tanto que :a=Ý −1,4 ∙ X́ =4−1,4 ∙ 3=−0,2


^ =−0,2+1,4 ∙ X
La recta de mejor ajuste es: Y

Para determinar qué tan bueno fue el ajuste lineal se calcula el coeficiente de correlación lineal de
Pearson denotado como r XY si el estudio involucra a las variables X e Y.

Este indicador mide el grado de relación lineal entre las variables X e Y y viene dado por la fórmula:

COV (X , Y )
r XY =
σ X ∙ σY
donde−1 ≤r XY ≤ 1

Acá si r XY =1indica una relacion perfecta positiva entre las variables

Si r XY =−1 indicauna relacion perfecta negativa entre las variables

Si r XY =0 indicauna ausenciade relacionlineal entre las variables

A la información bivariada se le puede ajustar también una curva no lineal se habla en este caso de
ajustes no lineales

AJUSTE POTENCIAL: En este caso la curva a ajustar es de la forma: ^y =a ∙b x donde los coeficientes
de regresión a y b se determinan como sigue:

En ^y =a ∙ b x se aplica Logaritmo natural en amboslados de la igualdad y nos queda


ln ^y =ln a+ x ∙ ln b siendo y =ln ^y A=Lna y B=ln b de este modo queda linealizado el modelo
como:

COV ( X ,Y )
y =A +B ∙ x donde B= ; y A= ý −B ∙ x́
σ 2x

Finalmente a=e A y b=e B


COV ( X , Y )
Tambien:r XY =
σX∙σ y

También podría gustarte