Está en la página 1de 25

ANÁLISIS DE REGRESIÓN

PROF. GRABIELA MONTES Q.


El análisis de regresión permite encontrar
una función que describa la forma de la
relación entre variables.
Si se estudian dos variables, una
independiente, X, y otra dependiente, Y,
entonces tendremos una “regresión simple”.
Si se tuvieran k variables independientes,
X1,…, Xk, y una variable dependiente, Y, el
análisis se llamaría “regresión múltiple”.
En este caso la relación entre las dos
variables es una recta, de la forma:
Yi  β 0  β1X i  ε i
Donde:
Yi es la variable dependiente
Xi es la variable independiente
β0 es el intercepto de la recta
β1 es la pendiente de la recta
i es el término de error aleatorio, el cual tiene
distribución normal de media 0 y varianza 2
El primer paso, para ver si existe o no una
relación lineal entre las variables, es construir
un diagrama de dispersión de los datos.
En el gráfico podemos observar que existe
relación inversa entre las variables.
Para estimar los parámetros β0 y β1, se aplica el método
de los mínimos cuadrados, con base a una muestra de
tamaño n, mediante el cual se minimiza la función:

 
n n
D   ε   Yi  Ŷi
2
2
i
i 1 i 1
Donde

Ŷi  β̂ 0  β̂1 Xi
Al minimizar D los estimadores
obtenidos son:
n

x y i i n x y
β̂1  i 1
n

x
i 1
2
i n x 2

β̂ 0  y  β̂1x
Los estimadores encontrados se
reemplazan en la ecuación obteniéndose la
ecuación estimada de la forma:

Ŷi  β̂ 0  β̂1Xi
Con esta recta estimada se pueden hacer
estimaciones del valor de Y para valores fijos de X
Se definen los residuales como: Yi  Ŷi
Generalmente la varianza del error es
desconocida, y podemos estimarla a partir
del “Error Estándar de Estimación”, Se,
donde:

Se  σ̂   y 2
 β̂ 0  y  β̂1  xy
n2

Valores pequeños de Se indican que los puntos


observados están cercanos a la recta de
Regresión.
Particularmente nos van ha interesar tres
intervalos de confianza:
1. Intervalo de confianza para la pendiente
de la recta al (1-α)100%:

β̂1  t n  2;1α/2  σ̂1

Se
donde : σ̂1  n

 i
x 2

i 1
 nx 2
2. Intervalo de confianza del Valor Medio de
Y, para un valor fijo x0, al (1-α)100%:
 1  x0  x
2 

 ŷ  t n  2;1α/2 Se  2 
 n  x  nx 
2

3. Intervalo de confianza del predictor de Y, para


un valor fijo x0, al (1-α)100%:
 1 x0  x
2 

 ŷ  t n  2;1α/2 Se 1   2 
 n  x  nx 
2
 El MINITAB calcula los intervalos para la
media de Y y para el predictor de Y dados
valores de la variable independiente X.
Se desea probar las hipótesis:
H0: β1= 0 , la relación no es significativa
H1: β1≠ 0 , la relación si es significativa
El estadístico de prueba está dado por F0
obtenido de la tabla ANOVA.
TABLA ANOVA

F. de V. S.C. g.l. C.M. F0


Regresión SCR 1 CMR CMR/ CME
Error SCE n-2 CME
Total SCT n-1

F. De V. : Fuente de variación
S.C.: Suma de cuadrados
g.l.: Grados de libertad
C.M.: Cuadrados Medios
F0: Estadístico de prueba
El criterio de decisión es:

Rechazar H0 si Fc  F1, n 2 , 1α 

El rechazo de H0 lleva a la conclusión que


existe una buena relación lineal entre las
variables.
EJEMPLO
Los siguientes datos
corresponden a:

Y : Cantidad demandada
X : Precio en dólares

Se ingresan los datos al


Minitab.
La secuencia a seguir es:
Stat > Regression > Regression > Fit Regression Model…
Completar los datos pedidos:

En Options: Escoger el nivel de confianza deseado.


En Storage: Seleccionar Residuals.
Cuando necesite los intervalos de confianza para la
media de Y o para la predicción de Y, seguir la
secuencia Stat > Regression > Regression > Predit,
colocar los nuevos valores de X y en Options elegir el
nivel de confianza deseado.
Los resultados son:
Asumiendo que deseamos intervalos de confianza y de
predicción para X = 135 tenemos:
Los siguientes gráficos sirven para la validación
del modelo
Residual Plots for Y
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99 10

90
5

Residual
Percent

50
0
10
-5
1
-10 -5 0 5 10 160 170 180 190
Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


10
2.0

1.5 5
Frequency

Residual
1.0
0
0.5
-5
0.0
-5.0 -2.5 0.0 2.5 5.0 7.5 1 2 3 4 5 6
Residual Observation Order
Este valor sirve para medir la fuerza de la
relación lineal entre X e Y.
Se calcula mediante la expresión:

x y i i nxy
r i 1

 n 2  n
2
  x i  n x   y i  n y 
2 2

 i 1  i 1 
Cuando r es positivo la relación lineal entre X e Y
es directa.
Cuando r es negativo la relación lineal entre X e Y
es inversa.
Cuando r = 0 no existe relación lineal entre las
variables.
Cuando más se acerca el valor absoluto de r a uno,
la relación es más fuerte y cuando más se acerca a
cero la relación es más débil.

Para el ejemplo tenemos que r=-0.9053, por lo


tanto al relación lineal entre las dos variables es
inversa y fuerte.
Mide el porcentaje de explicación de la variable
dependiente debida a la variable independiente o a
la regresión.
Se calcula como el cuadrado de r.
Coef.Determ = r2*100
Con MINITAB el coeficiente de determinación está
dado por R-sq.
Para el ejemplo R-sq = 81.95%

También podría gustarte