Regresión Lineal Simple

REGRESIÓN LINEAL SIMPLE
INTRODUCCIÓN
El análisis de regresión es una técnica estadística útil para investigar y modelar la relación entre
variables. Existen numerosas aplicaciones de regresión en casi cualquier campo, como por
ejemplo en ingeniería financiera, ciencias físicas y químicas, economía, administración, entre
otras. De hecho, puede ser que el análisis de regresión sea una de las más usadas técnicas
estadísticas.
El modelo de regresión lineal que vamos a considerar se divide en el modelo de regresión

simple y el modelo de regresión múltiple. El análisis de regresión lineal simple tiene por objeto
estimar la relación funcional entre dos variables, mientras que, el análisis de regresión múltiple
tiene por objeto estimar el efecto que tiene múltiples variables, (variables independientes), sobre
la variable de interés, (variable dependiente).
REGRESIÓN LINEAL SIMPLE
En este capítulo y en los siguientes se estudiarán situaciones que involucran dos o más variables
numéricas como medios para observar las relaciones existentes entre ellas.
El modelo de regresión lineal simple, es un modelo con dos variables, por ejemplo X y Y en
donde X es el regresor, Y es la variable respuesta y la relación entre las variables se supone es
una línea recta. De esta forma se puede decir que la variable Y es una variable dependiente o
explicada y la variable X es la variable independiente o explicativa. También es usual hablar de
variable endógena y exógena, respectivamente.
Como ejemplo suponga que X es el precio de un determinado bien a lo largo del tiempo, y Y
es la cantidad demandada del mismo. Suponga que se dispone de n observaciones de la variable
Y correspondientes a n observaciones de X y que se desea estimar la relación existente entre
la cantidad demandada y su precio. Además suponga que la relación es lineal y que la cantidad
demandada sólo depende del precio, la ecuación que se pretende estimar se puede escribir
como:
Y  0  1 X (1.1)
Los parámetros  0 y 1 de la ecuación anterior son desconocidos y representan el intercepto

con el eje Y y la pendiente de la línea recta, respectivamente;
Para el ejemplo descrito, por teoría económica se espera que la pendiente sea negativa. El
conocimiento de estos parámetros permite determinar en cuánto se reduce la demanda al
14 REGRESIÓN LINEAL SIMPLE
aumentar el precio y también predecir el valor de la cantidad demandada, dado un precio. El

modelo formulado en la ecuación (1.1) es determinista.
A continuación se presentan los datos de la demanda mensual de televisores y su precio unitario

(en miles de pesos), para los últimos 20 meses.
MES X Y MES X Y
1 60000 5124 11 75000 4386
2 64000 5045 12 76000 4213
3 65000 4905 13 78000 4040
4 63000 5030 14 82000 3875
5 66000 4612 15 83000 3124
6 70000 4531 16 83500 2890
7 80000 3273 17 86000 2757
8 76000 4227 18 80000 2220
9 70000 4608 19 90000 2780
10 74000 4490 20 91000 2364
Se pretende entonces determinar si los precios de televisores pueden ayudar a determinar la

demanda que la empresa tendrá en el futuro.
En términos gráficos, la relación lineal que se supone existe entre ambas, y que se desea
estimar, se presenta en la siguiente figura
SUPUESTOS DEL MODELO CLÁSICO DE REGRESIÓN LINEAL 15
Diagrama de dispersión Y vs. X Se observa que la relación entre las dos

variables no es una línea recta exacta.
DEMANDA
Existen varias causas para ello, podemos
6000 citar algunas:
 En el ejemplo, se supone que la
5000 demanda sólo depende del precio. Sin
embargo, esto no es necesariamente
cierto pues, existen otras variables que
4000 inciden en la demanda, como los
ingresos, la inversión en publicidad, los
precios de otras marcas, entre otras. En
3000
general, sobre una variable Y inciden
múltiples factores X , que no son
2000 PRECIO tenidos en cuenta en la formulación
50000 60000 70000 80000 90000 100000 (1.1)
 Los errores de medida en las variables.
En resumen, el modelo planteado en la ecuación (1.1) parece bastante limitado. Una forma de
resolver esta limitación consiste en incorporar una variable aleatoria al modelo que recoja
variables omitidas, errores de medida, entre otras. De esta forma el modelo pasa a ser
estocástico y adquiere la forma:
Yi  0  1 X i   i (1.2)
Donde  i es una componente aleatoria de error o también llamada variable aleatoria no

observable, es decir, es lo que afecta la variable endógena que no lo explica la variable exógena.
 0 y 1 son los parámetros desconocidos del modelo, X la variable exógena y Y la variable
endógena.
Para que la ecuación (1.2) sea válida, se supone, inicialmente, que los factores recogidos en  i
no influyen sistemáticamente en Y sino que, su incidencia es simplemente aleatoria.
En la práctica, se dispone de una muestra aleatoria de n observaciones de la variable Y

correspondientes a n observaciones de la variable X , en n pares ordenados de la forma
( X i , Yi ) a partir de la cual se estiman los parámetros de la regresión.
SUPUESTOS DEL MODELO CLÁSICO DE REGRESIÓN LINEAL
Los parámetros  0 y 1 se pueden estimar de manera formal para que la recta de regresión
tenga propiedades razonables. Un método de estimación de los parámetros es el método de
mínimos cuadrados que consiste en minimizar la suma de los cuadrados de los errores; pero no
siempre este es el método más adecuado, aunque en la literatura es uno de los más usados. Se
requiere entonces aceptar algunos supuestos que hagan que los estimadores de mínimos
cuadrados cumplan con algunas propiedades estadísticas deseables.
1) El modelo de regresión es lineal en los parámetros, es decir, el término Regresión Lineal

significa que la regresión es lineal con respecto a los parámetros (los betas), puede ser o no
lineal en las variables explicativas. De manera que si en el modelo se tienen productos,
cocientes u otras operaciones entre los parámetros distintas de la suma, entonces en el
modelo no hay linealidad con respecto a los parámetros. Por ejemplo,
1
a) Yi  0  1 X i   i Modelo lineal b) Yi   0   i Modelo lineal
Xi
c) Yi  0  12 X i2   i Modelo no lineal d) LnYi  0  1 X i   i Modelo lineal
1 1
e) Yi  0  X  Modelo no lineal f) Yi  0  1 Ln  i Modelo lineal
2 i i Xi
2) Las variables regresoras X son variables consideradas no estocásticas (no son variables
aleatorias). Las X toman valores fijos.

3) El valor medio de la perturbación estocástica es igual a cero. Es decir E  i X  xi  0 
Obsérvese que,
E (Yi X  xi )  E (  0  1 X i  εi X  xi )
 E (  0  1 X i X  xi )  E (εi X  xi )
  0  1 X i
Y
FRP: Yi  0  1 X i
Media
εi
ε i
X
X1 X2 X3 X4
ESTIMACIÓN DE LOS PARÁMETROS POR MÍNIMOS CUADRADOS 17
4) La varianza (o dispersión) de la perturbación estocástica es la misma en todas las

observaciones. Es decir, la varianza de εi es constante. Este supuesto se llama “supuesto de
Homoscedasticidad”. (homo = igual, cedasticidad = varianza). Es decir V ( i )   2
La expresión anterior establece entonces que la varianza de cada εi , es algún número

positivo constante e igual a  2
Por lo tanto la distribución de probabilidad de la variable endógena es:

Yi ~ N  0  1 X i ,  2

Nota. Si la varianza condicional varía, se dice que en el modelo hay presencia de
heterocedasticidad y se escribe V ( i )   i2 . Obsérvese que el subíndice en  2 es el indicador
de que la varianza de la población Y ya no es constante.
5) La perturbación estocástica se distribuye normalmente. Es decir  i ~ N (0,  2 )
6) Los errores son incorrelacionados. Las variables aleatorias  i y  j son estadísticamente

independientes. Es decir para todo i  j se tiene que, Cov( i ,  j )  0
7) El número de observaciones debe ser mayor que el número de parámetros a estimar. De

manera alternativa el número de observaciones debe ser mayor que el número de variables
explicativas.
ESTIMACIÓN DE LOS PARÁMETROS POR MÍNIMOS CUADRADOS
Como se ha dicho los parámetros  0 y 1 son desconocidos, y se deben estimar con los datos
de la muestra. Suponga que se tienen n pares de datos muéstrales tomados de una distribución
normal, ( x1 , y1 ),( x2 , y2 ),...,( xn , yn ) , estos datos pueden obtenerse en un experimento
controlado, diseñado en forma específica para recolectarlos, o a partir de registros históricos
existentes (lo que se llama un estudio retrospectivo).
OBTENCIÓN DE LOS ESTIMADORES

El método de mínimos cuadrados consiste en estimar los parámetros  0 y 1 tales que la suma
de los cuadrados de los errores sea mínima. Es decir, el objetivo del método de mínimos
cuadrados es minimizar la función dada por
n n
  i2   Yi  0  1 X i 
2
f (  0 , 1 ) 
i 1 i 1
Para minimizar f se debe derivar parcialmente con respecto a  0 y 1 e igualar a cero las
derivadas.
f n
Derivando con respecto a  0 se obtiene
 0
 2 (Yi   0  1 X i )
i 1

e igualando a cero queda
n
2  (Y  
i 1
i 0  1 X i )  0
n n
 Yi  n0  1  X i
i 1 i 1
nY  n 0  n1 X
y por lo tanto,
Y  0  1 X (1.3)
Derivando ahora parcialmente con respecto a 1 , e igualando a cero, se obtiene

f n
 2 Yi   0  1 X i X i
1 i 1
n
2 Yi   0  1 X i X i  0
i 1
operando se encuentra,
n n n
 X iYi  0
i 1
 X i  1  X i 2
i 1 i 1
n n
 X Y  n
i 1
i i 0 X  1  X i 2
i 1
(1.4)
Las ecuaciones (1.3) y (1.4) se llaman ecuaciones normales de mínimos cuadrados. Estas
ecuaciones se deben resolver simultáneamente para encontrar  0 y 1
De la ecuación (1.3) se tiene que 0  Y  1 X . Este resultado se sustituye en la ecuación (1.4)

y se obtiene que
n n
 X iYi  X  nY  n1 X i   1 X i
2
i 1 i 1
n n
 X Y  nXY  n X
i 1
i i 1
2
 1 X
i 1
i
2
 n
 n
1   X i2  nX 2    X iYi  nXY
 i 1  i 1
y finalmente queda la siguiente expresión

n
 X Y  nXYi i
ˆ1  i 1
n
(1.5)
X
i 1
i
2
 nX 2
y sustituyendo la ecuación (1.5) en la ecuación (1.3) se obtiene que ˆ0  Y  ˆ1 X . Por lo
tanto, la ecuación de regresión estimada es
Yî  ˆ0  ˆ1 X i (1.6)
Ahora como el denominador en la ecuación (1.5) es la suma corregida de cuadrados de las Xi ,

denotada S x x , es decir
2
n
1 n 
S xx    X i     Xi 
2
i 1 n  i 1 
y el numerador es la suma corregida de los productos cruzados de X i y Yi , denotada S x y , es

decir
n
1 n n n
S xy   X iYi   i Yi ,
X ó S xy    X i  X Yi  Y 
i 1 n i 1 i 1 i 1
entonces ˆ1 se puede escribir en forma compacta como,

n
 X i  X Yi  Y 
S xy
ˆ1  i 1
2

n S xx
 Xi  X 
i 1
La expresión anterior se puede simplificar para facilitar las demostraciones que puedan
presentarse más adelante, a través del siguiente procedimiento:
n n n
 ( X i  X )(Yi  Y )  Y (X i i  X ) Y (Xi  X )
ˆ1  i 1
 i 1 i 1
S xx S xx
n
ahora, como (X
i 1
i  X )  0 entonces
n
Y ( X i i  X) n
(Xi  X )
ˆ1  i 1
  CiYi donde Ci 
S xx i 1 S xx
EJEMPLO. Para la muestra de la demanda mensual de televisores y su precio unitario (en

miles de pesos), en los últimos 20 meses, efectuar la regresión de la demanda mensual de
televisores ( Y ) sobre el precio unitario de los mismos en pesos. Los resultados se muestran en
la siguiente salida de EVIEWS
Variable Dependiente: DEMANDA

Método: Mínimos Cuadrados
Observaciones incluidas: 20
Variable Coeficiente Error Estándar Estadístico t Prob.

C –0.094697 0.010408 –9.098825 0.0000
PRECIO 11086.19 792.4359 13.99001 0.0000
R -cuadrado 0.821408 Media variable Dependiente 3924.700

R- cuadrado ajustado 0.811487 Desv. Est. variable dependiente 947.5082
Desv. Est. de la regresión 411.3903 Criterio de Akaike 14.97160
Suma residuos cuadrados 3046355. Criterio Schwarz 15.07117
Log likelihood –147.7160 Estadístico F 82.78862
Estadístico Durbin-Watson 1.594529 Prob (estadístico F) 0.000000
De esta forma, ̂0  11086.19 y ˆ1 =  0.094697
Estos valores tienen los siguientes significados. El valor ˆ1 =  0.094697 indica que por cada
aumento de mil pesos en el precio de televisores, se espera que la demanda de estos se reduzca
en 0.094697 unidades. Por su parte ̂0  11086.19 indica que hay una demanda de 11086
televisores, cuando el precio de estos es cero; es importante indicar que este valor no tiene
interpretación económica.
Entonces, la ecuación ajustada se puede escribir como:
Yî  11086.19  0.094697 X i

De esta forma, sí por ejemplo X i  X  75625 entonces,
Yî 11086.19  0.094697  75625  3924.7
Que coincide con el valor de Y  3924.7
PROPIEDADES DE LOS ESTIMADORES POR MÍNIMOS CUADRADOS
Los estimadores por mínimos cuadrados tienen las siguientes propiedades que son muy
importantes en el análisis de regresión lineal:
1) ˆ1 es un estimador insesgado de 1 . Es decir, E ( ˆ1 )  1
2) ̂ 0 es un estimador insesgado de  0 . Es decir, E ( ˆ0 )  0
2
3) La varianza de ˆ1 se calcula con la expresión Var ( ˆ1 ) 
S xx
2 1 X2
 2
X i
2
4) La varianza de ̂ 0 ˆ
se calcula como Var (  0 )     
i 1
 n S xx  nS xx
De los resultados anteriores se tiene entonces que
 2   1 X 2 
a) ˆ1 ~ N  1 ,  b) ˆ0 ~ N   0 ,  2   
 S xx  
 S xx   n
En donde  2 es desconocida y se estima por medio de datos muestrales.

ESTIMACIÓN DE LA VARIANZA
En las expresiones que se obtuvieron para las varianzas y covarianzas de los estimadores
aparece el parámetro poblacional  2 , el cual es generalmente desconocido y por lo tanto se
debe estimar para obtener las varianzas y covarianzas de ̂ 0 y ˆ1 ; además de estimar los
parámetros  0 y 1 , se requiere un estimador de la varianza para hacer pruebas de hipótesis y
formar estimados de intervalos pertinentes al modelo de regresión. En el caso ideal este
estimado no debería depender de la ecuación del modelo ajustado.
TEOREMA
Un estimador insesgado de  2 es S 2 , siendo

n
e 2
i
S yy  ˆ12 S xx
S 
2 i 1

n2 n2
Aquí  2 es la varianza poblacional y S 2 es la varianza muestral.
INFERENCIA PARA LOS PARÁMETROS DEL MODELO
Al estudiar la recta de regresión poblacional

Yi  0  1 X i   i
se obtuvieron estimadores puntuales, mediante el método de mínimos cuadrados ordinarios, de
los parámetros desconocidos  0 y 1 . Además, bajo el cumplimiento de ciertas hipótesis, los
estimadores de mínimos cuadrados tienen propiedades deseables, en virtud del teorema de
Gauss-Markov. Sin embargo, la estimación puntual no suele ser suficiente si se necesita
completar el análisis de los datos. Es obvio preguntarse sobre la precisión de los resultados
obtenidos, por ejemplo ¿qué tan cerca está ˆ1 de 1 ?. También es necesario encontrar qué tan
cerca está la observación de cierto valor hipotético. Por lo anterior se considerará, a
continuación, los problemas de construcción de intervalos de confianza y contrastes de hipótesis
para los parámetros de regresión poblacional.
INTERVALOS DE CONFIANZA
Es común, en estadística, usar el error estándar para medir la confiabilidad de un estimador
puntual. Por lo cual, y para mayor seguridad en la estimación, se puede construir un intervalo
que contenga el estimador puntual. Si se desea encontrar qué tan cerca está ˆ1 de 1 , se deben
ESTIMACIÓN DE LA VARIANZA 23
determinar dos números positivos  y  con 0    1 , tal que la probabilidad de que el

intervalo (ˆ1   , ˆ1   ) contenga el verdadero valor de 1 sea igual a 1   ; lo cual se
expresa como
P(ˆ1    1  ˆ1   )  1  
El intervalo (ˆ1   , ˆ1   ) se llama intervalo de confianza; 1   se denomina coeficiente de

confianza y a  se le llama nivel de significancia. Se debe anotar que  y 1   se expresan
en términos porcentuales. Por ejemplo, si   0.05 entonces se escribe
P(ˆ1    1  ˆ1   )  0.95
y se lee: la probabilidad de que 1 esté en el intervalo (ˆ1   , ˆ1   ) es 0.95 o 95%

Interpretación del intervalo de confianza: Si el valor de la variable exógena experimenta un

incremento unitario, se tiene una confianza del 1   100% que el valor promedio de la
variable endógena se incremente entre el límite inferior y el límite superior del intervalo.
INTERVALO DE CONFIANZA PARA LA PENDIENTE DE LA RECTA DE

REGRESIÓN POBLACIONAL CON  2 DESCONOCIDA
Un intervalo de confianza del 1   100% para el parámetro 1 en la línea de regresión

 Yi   0  1 X i es
ˆ1  t( / 2,n2) Sˆ  1  ˆ1  t( / 2,n2) Sˆ
1 1
o de igual manera
S S
ˆ1  t( / 2,n2)  1  ˆ1  t( / 2, n2)
S xx S xx
S
lo cual se puede escribir de manera más compacta como ˆ1  t( / 2, n 2)
S xx
y se puede entonces escribir que
 S S 
P  ˆ1  t( / 2,n 2)  1  ˆ1  t( / 2, n 2)   1 
 S xx S xx 
 
Donde t( / 2,n 2) es un valor de la distribución t de student para un nivel de confianza de
1   100% con n  2 grados de libertad.
INTERVALO DE CONFIANZA PARA LA ORDENADA EN EL ORIGEN CON  2
DESCONOCIDA
Un intervalo de confianza de 1   100% para los valores del parámetro  0 en la línea de
regresión  Yi   0  1 X i está dado por
ˆ0  t( / 2,n2) S ˆ  0  ˆ0  t( / 2,n2) S ˆ

0 0
o de igual manera
1 X2 1 X2
ˆ0  t( / 2,n2) S   0  ˆ0  t( / 2, n 2) S 
n S xx n S xx
INFERENCIA PARA LOS PARÁMETROS DEL MODELO 25
ˆ 1 X2
o de manera más compacta  0  t( / 2,n 2) S 
n S xx
y es equivalente a escribir
 1 X2 1 X2 
P  ˆ0  t( / 2,n 2) S   0  ˆ0  t( / 2, n 2) S    1
 n S n S xx 
 xx 
Aquí también t( / 2,n 2) es un valor de la distribución t de student para un nivel para un nivel de
confianza de 1   100% con n  2 grados de libertad.
PRUEBAS DE HIPÓTESIS PARA LOS PARÁMETROS DEL MODELO CON  2

DESCONOCIDA
El interés ahora es determinar si es compatible o no una observación dada, con alguna hipótesis
planteada. La hipótesis planteada es llamada hipótesis nula y se denota como H 0 . Generalmente
la hipótesis nula se contrasta frente a otra hipótesis llamada hipótesis alternativa denotada
como H a . El objetivo es entonces, en estas pruebas, tener un método que permita decidir acerca
de la validez de una hipótesis dada.
PRUEBA O CONTRASTE DE HIPÓTESIS PARA 1 CON  2 DESCONOCIDA
Sea  
1 un valor específico de 1 y además el estadístico de prueba T definido como
ˆ1  1
T
S ˆ
1
i) Para contrastar la hipótesis nula H 0 : 1  1 frente a la hipótesis alternativa H a : 1  1 ,

la regla de decisión es rechazar la hipótesis nula si T  t ( ,n2) . Donde t( ,n 2) es el valor de
la distribución t de student para un nivel de significancia de  con n  2 grados de libertad.
ii) Para contrastar la hipótesis nula H 0 : 1  1 frente a la alternativa H a : 1  1 la regla
de decisión es rechazar H 0 si T  t ( ,n2)
iii) Para contrastar la hipótesis nula H 0 : 1  1 frente a la alternativa bilateral H a : 1  1 ,
la regla de decisión es rechazar H 0 si | T |  t( / 2, n2)
Lo cual es equivalente a tener T  t( / 2, n2) o T   t( / 2, n2)
CASOS ESPECIALES (Significancia de la Regresión)
1) Si se tiene
H 0 : 1  0
H a : 1  0
No rechazar la hipótesis nula significa que no hay una relación lineal entre la variable exógena y
la endógena.
Rechazar la hipótesis nula H 0 indica que la variable exógena es significativa en el modelo, es

decir, la variable exógena ayuda a explicar las variaciones de la variable endógena. Cuando la
hipótesis nula se rechaza, se dice que el hallazgo es estadísticamente significativo.
2) Si se tiene
H 0 : 1  1
H a : 1  1
No rechazar la hipótesis nula, H 0 : 1  1 significa que hay una relación uno a uno entre las
variables. Es decir, cualquier incremento en la variable exógena genera el mismo incremento, en
la variable endógena. Rechazar H 0 , significa que no existe una relación uno a uno entre las
variables endógena y exógena.
INFERENCIA PARA LOS PARÁMETROS DEL MODELO 27
PRUEBA O CONTRASTE DE HIPÓTESIS PARA  0 CON  2 DESCONOCIDA
Sea  0 un valor específico para  0 , en la recta de regresión y sea además

ˆ0   0
T
S ˆ
0
el estadístico de prueba.
i) Para contrastar la hipótesis nula H 0 : 0  0 frente a la alternativa H a : 0  0 , la regla de

regresión es rechazar H 0 si T  t( , n 2)
ii) Para contrastar la hipótesis nula H 0 : 0  0 frente a la alternativa H a : 0  0 la regla de
decisión es rechazar H 0 si T  t( , n2)
iii) Para contrastar la hipótesis nula H 0 : 0  0 frente a la alternativa bilateral H a : 0  0 la
regla de decisión es rechazar H 0 si | T |  t( / 2, n2) , lo cual es equivalente a decir que H 0 se
rechaza si T  t( / 2, n2) o T  t( / 2, n2)
Si se tiene
 ˆ 
H 0 : 0  0  
0  0 T  0 
 S ˆ 
 0 
Frente a la alternativa H a : 0  0 , rechazar H 0 significa que la ordenada en el origen,  0 , es

significativa en el modelo; no rechazar H 0 significa  0 es irrelevante en el modelo.
PREDICCIÓN
Una importante utilidad de la regresión es la de realizar predicciones de la variable dependiente

condicionada a un valor fijo de la variable independiente. Se supone que la variable
independiente es igual a cierto valor específico X 0 que resulte ser de interés, y que la relación
entre las variables dependiente e independiente es lineal.
Si se tiene en cuenta la ecuación de regresión poblacional

Yi  0  1 X i   i
entonces el correspondiente valor de la variable dependiente será:

Y0  0  1 X 0   i
el cual, dado X 0 tiene esperanza condicional

 Y | X  X 0   Y | X 0  0  1 X 0
y como ˆ0 y ˆ1 son los mejores estimadores puntuales de  0 y 1 , respectivamente, entonces
Ŷ0  ˆ0  ˆ1 X 0
Siendo Yˆ0 el valor promedio predicho de la variable Y cuando X  X 0 .
Ahora el interés está centrado en dos problemas de predicción distintos:
1) Se puede estimar el verdadero valor que se obtendrá para Yˆ0 .

2) Se puede estimar la esperanza condicional E(Y0 X  X 0 ) , es decir, el valor promedio de la
variable dependiente cuando se fija en X 0 la variable dependiente.
INTERVALO DE CONFIANZA PARA LA PREDICCIÓN

i) El intervalo de confianza del 1   100% para el valor esperado  Y | X  X 0   Y | X 0 es
1  X0  X  1  X0  X 
2 2
Yˆ0  t( / 2,n2) S   Y | X 0  Yˆ0  t( / 2, n 2) S 

n S xx n S xx
y como Ŷ0  ˆ0  ˆ1 X 0 , se puede expresar de manera más compacta como
1  X0  X 
2
ˆ0  ˆ1 X 0  t( / 2,n2) S 

n S xx
SSE S yy  ˆ12 S xx
Donde S 2  o de igual manera S 
n2 n2
Obsérvese que si se deja n fijo y se toma X 0  X , el intervalo de confianza se acorta y se hace

más pequeño a medida que n aumente.
PREDICCIÓN 29
ii) El intervalo de confianza del 1   100% para el valor verdadero de la variable explicada
Y0 está dado por
1  X0  X  1  X0  X 
2 2
Yˆ0  t( / 2,n 2) S 1    Y0  Yˆ0  t( / 2, n 2) S 1  

n S xx n S xx
y como
Ŷ0  ˆ0  ˆ1 X 0
entonces
1  X0  X  1  X0  X 
2 2
Yˆ0  t( / 2,n 2) S 1    Y0  ˆ0  ˆ1 X 0  t( / 2, n 2) S 1  

n S xx n S xx
de manera más compacta
1  X0  X 
2
ˆ0  ˆ1 X 0  t( / 2,n2) S 1  

n S xx
Obsérvese que los intervalos de predicción del valor de Y son más amplios que los intervalos
de confianza de E (Y ) si ambos se determinan para un mismo valor X  X 0
EJEMPLO. Para una muestra de 20 observaciones mensuales, un Ingeniero Financiero quiere

efectuar la regresión lineal de la tasa porcentual de rendimiento de las acciones de una empresa
( Y ) sobre la tasa porcentual de rendimiento de un índice bursátil ( X ). El ingeniero dispone de
la siguiente información:
 Y  22.6
i  X Y  150.5
i i X i
2
 145.7
 X  25.4
i Y  196.2
i
2
a) Suponiendo que existe una relación lineal entre las variables. Encuentre, por mínimos
cuadrados ordinarios, el modelo de regresión e interprete la pendiente.
b) Contraste la hipótesis de que la tasa porcentual de rendimiento de un índice bursátil es

significativa en el modelo. Tome   0.01
c) Halle e interprete un intervalo de confianza del 90% para el rendimiento porcentual esperado
de las acciones cuando el rendimiento del índice bursátil es del 1%.
SOLUCIÓN
Se tiene que n  20 , X  1.27 , Y  1.13

S xy
a) Como ˆ1  encontramos primero S xy y S xx
S xx
S xy   X iYi  n X Y S xx   X i 2  n X 2
 150.5   20 1.27 1.13  145.7  20 1.27 
2
 121.80  113.44
luego
S xy 121.80
ˆ1    1.074
S xx 113.44
Como ˆ0  Y  ˆ1 X , entonces
ˆ0  Y  ˆ1 X  1.13  1.074 1.27   0.234

y finalmente Yi  0.234  1.074 X i
Interpretación. ̂1  1.074 significa que por cada incremento del 1% de la tasa porcentual de
rendimiento de un índice bursátil, se espera que la tasa porcentual de rendimiento de las
acciones de una empresa aumente en 1.074%
b) Se plantea el contraste
H 0 : 1  0
H a : 1  0
El estadístico de prueba es
ˆ1  1
T
Sˆ
1
ˆ1
si 1  0 entonces T 
Sˆ
1
Para encontrar S ˆ , se debe primero calcular S yy y S 2

1
PREDICCIÓN 31
Para S yy , se tiene que

S yy   Yi 2  nY 2
 196.2  20 1.13  170.662
2
y
S yy  ˆ12 S xx 170.662  1.153 113.44 
S2    2.215
n2 18
luego
S 1.49
Sˆ    0.14
1 S xx 10.65
ˆ1 1.074
y por lo tanto T    7.68
Sˆ 0.14
1
La regla es rechazar H 0 si | T |  t ( / 2,n2) . Como t( / 2,n2)  t 0.005,18  2.878 , se rechaza la

hipótesis nula y esto significa que la tasa porcentual de rendimiento de un índice bursátil ayuda
a explicar linealmente la variabilidad de la tasa porcentual de rendimiento de las acciones de
una empresa.
c) Se sabe que el para Y | X 0 se expresa como
1  X0  X  1  X0  X 
2 2
ˆ0  ˆ1 X 0  t ( / 2,n2) S   Y | X 0  ˆ0  ˆ1 X 0  t ( / 2, n 2) S 

n S xx n S xx
y al reemplazar se obtiene
0.6228  Y | X  1.0572
0
Interpretación. Si el rendimiento del índice bursátil es del 1% se espera, con una confianza del
90%, que el rendimiento de las acciones de una empresa esté entre el 0.6228% y el 1.0572%.
ANÁLISIS DE VARIANZA
El análisis de varianza es otra prueba de la hipótesis nula H o : 1  0 frente a la alternativa

bilateral H a : 1  0 . La técnica, antes vista, tan solo usa la distribución t  student ; el
objetivo ahora es utilizar la distribución F para analizar la bondad o calidad del ajuste de la
línea de regresión estimada. Es decir, el deseo es determinar si variable exógena influye

linealmente sobre la endógena.
Como hasta ahora solo se ha analizado el caso en que solo se tiene una variable regresora, la
prueba F debe mostrar la misma conclusión que la prueba t ; es decir, si la prueba t indica que
1  0 y por lo tanto hay una relación significativa, la prueba F también indicará una prueba
significativa. En capítulos posteriores, se mostrará que cuando hay más de una variable
regresora solo se puede usar la prueba F para analizar si hay una relación global significativa
entre las variables.
El procedimiento consiste en subdividir la variación total de la variable dependiente en las

componentes significativas que se observan y se parte entonces de la expresión.
De manera que si se define:
Yi : valor observado
Yî : valor estimado
ei  Yi  Yî : residuales del modelo.
Yî  Y : Desviación de los valores estimados con respecto a la media; puntos que caen en la
recta.
entonces se plantea que,

Yi  Y  (Yî  Y )  ei
elevando al cuadrado a ambos lados se obtiene,
Y  Y   Yˆ  Y   
2
 2 Yî  Y ei  ei 2
2
i i
y por lo tanto,
 Y  Y   Yˆ  Y   
n n n n
 2 Yî  Y ei   ei 2
2 2
i i
i 1 i 1 i 1 i 1
 Yˆ  Y  e
n
Por propiedades de los residuales i i  0 , luego
i 1
 Y  Y   Yˆ  Y    Y  Yˆ 
n n 2 n 2
2
i i i
i 1 i 1 i 1
ANÁLISIS DE VARIANZA 33
La expresión anterior es llamada identidad fundamental del análisis de varianza. El lado

izquierdo de la ecuación es la suma corregida de cuadrados de las observaciones (SST), que
mide la variabilidad total en las observaciones. Es decir,
n
SST   Yi  Y 
2
i 1
Las dos componentes de (SST) miden, respectivamente, la cantidad de variabilidad en las

observaciones Yi explicada por la línea de regresión (SSR) y la variación residual que queda sin
explicar por la línea de regresión (SSE). De manera que,
   
n n
SSR   Yî  Y SSE   Yi  Yˆ
2 2
,
i 1 i 1
Con estas notaciones la identidad fundamental del análisis de varianza se puede reescribir como,
SST  SSR  SSE
Donde, SST  S yy , SSR  ˆ12 S xx y SSE  S yy  ˆ12 S xx
PRUEBA DE HIPÓTESIS DE UTILIDAD DEL MODELO
Para contrastar la hipótesis nula H 0 : el modelo lineal no es significativo, frente a la alternativa

H a : el modelo lineal es significativo, la regla de decisión es rechazar H 0 si F  f (1, n  2) ,
donde SSR tiene un grado de libertad y SSE tiene n  2 grados de libertad.
Cuando se rechaza la hipótesis nula se concluye que hay una cantidad significativa de la
variable dependiente que es explicada por el modelo planteado. Es decir, el modelo es
significativo y la variabilidad en la variable independiente ayuda a explicar la variabilidad en la
variable dependiente. Si no se rechaza la hipótesis nula, es decir F está en la región de
aceptación, se concluye que los datos no reflejan suficiente evidencia para apoyar el modelo
postulado.
SSR SSR
Los cálculos para encontrar el estadístico de prueba F   2 , se resumen en la
MSE S
siguiente tabla:
TABLA ANOVA (Tabla de análisis de varianza)
Fuente de Suma de los Grados de Cuadrados

F
variación cuadrados libertad medios
SSR
REGRESIÓN SSR 1 SSR F
S2
SSE
ERROR SSE n2  MSE  S 2
n2
TOTAL SST n 1
COEFICIENTE DE DETERMINACIÓN
El coeficiente de determinación, denotado R 2 , es un estadístico que mide el porcentaje de

variación total en la variable dependiente y que puede ser explicado por la variabilidad en la
variable independiente. El coeficiente de determinación es una probabilidad que se define como:
SSR ˆ12 S xx
R 
2
o de igual forma se puede expresar como R 
2
, 0  R2  1
SST S yy
La interpretación de este coeficiente está dada por: “la variabilidad de la variable endógena es
explicada en R 2 % por la variable exógena” (Estandarizar el nombre de las variables). Por
ejemplo, si se tienen definidas las variables de decisión Y : ingresos por ventas y X : gastos en
promoción, y se obtuvo que R 2  97.16 , esto significa que la variabilidad esperada en los
ingresos por ventas es explicada en un 97.16 % por la variabilidad en los gastos de promoción.
OBSERVACIONES
 Yˆ  Y   0 , es decir Yˆ  Y , y esto significa que las variaciones en

n
i) Si R 2  0 entonces i i
i !
Y no son explicadas por las variaciones en X
 Yˆ  Y   Y  Y 
n 2 n
y por lo tanto Yˆ  Yi y
2
ii) Si R 2  1 entonces SSR  SST , es decir i i
i 1 i 1
esto significa que todos los puntos observados caen en la línea de regresión, por lo cual el
ajuste sería perfecto.
COEFICIENTE DE DETERMINACIÓN 35
Como SST  SSR  SSE , al dividir, a ambos lados, por la suma de los cuadrados totales se
obtiene
SSR SSE
1 
SST SST
n
SSR SSE e i
2
y como R 2  entonces R 2  1  o de manera equivalente R 2  1  n

i 1
 Y  Y 
SST SST 2
i
i 1
Se puede demostrar que SSR  ˆ1S xy , mediante el siguiente procedimiento.
   
2

n n
SSR  
2
Yî  Y ˆ0  ˆ1 X i  Y
i 1 i 1
   
n 2 n 2
  Y  ˆ1 X  ˆ1 X i  Y   ˆ1  X i  X 

i 1 i 1
n 2
 ˆ 2 1  X
i 1
i  X   ˆ12 S xx  ˆ1ˆ1S xx
 ˆ S 1 xy
COEFICIENTE DE CORRELACIÓN MUESTRAL
El coeficiente de correlación muestral, denotado por r, es una medida de asociación lineal entre
las variables X y Y y se define como
ˆ1S xy
r  R2 
S yy
La expresión anterior muestra que hay una relación estrecha entre el coeficiente de correlación
muestral y la pendiente de la línea de regresión. Sin embargo proporcionan información distinta.
S xy
Si se tiene en cuenta que ˆ1  , y se reemplaza en la expresión anterior, resulta entonces
S xx
ˆ1S xy S xy S xx
r  o también r  ˆ1
S yy S xx S yy S yy
r es un estimador puntual del coeficiente de correlación poblacional  . Es claro entonces que
r  0 si ̂1  0 y que r  0 si ̂1  0
Recordar que el valor de éste coeficiente está definido así:
cov( x, y)
 , 1    1
 x y
Lo cual entonces indica que los valores del coeficiente de correlación están entre 1 y 1 . A
continuación se muestran algunos posibles valores que puede tomar el coeficiente de correlación
muestral y el criterio que puede ser útil para su interpretación.
 r  1 , indica que existiría una relación lineal perfecta.
 r  0.8 , indica que existe una relación lineal fuerte entre las variables X y Y
 0.5  r  0.8 , indica que existe una relación lineal moderada entre las variables X y Y
 0  r  0.5 , indica que existe una relación lineal débil entre las variables X y Y
 r  0 , indica que no existe una relación lineal entre las variables X y Y

EJERCICIOS PROPUESTOS 37
EJEMPLO. Un analista cree que el último determinante de los rendimientos sobre el

activo ( Y ), son los préstamos sobre depósitos ( X ). Para una muestra de 20 bancos se
obtuvo la recta de regresión Y = 0.97 + 0.47 X , con coeficiente de determinación 0.72
a) Hallar el coeficiente de correlación muestral entre los rendimientos sobre el activo y los
préstamos sobre depósitos.
b) Contrastar a un nivel de significancia del 5% la hipótesis nula de que no hay una asociación
lineal entre los rendimientos sobre el activo y los préstamos sobre depósitos.
c) Encontrar S ˆ e interpretar.
1
SOLUCIÓN
a) r  R2  0.72  0.85
b) Con   0.05 se plantea el contraste de la hipótesis nula H 0 :   0 frente a la hipótesis

alternativa H a :   0
r n2 0.85 20  2 3.61

Se tiene T     6.81 y t 0.025,18  2.101
1 R 2
1  0.72 0.53
Como 6.81  2.101, se rechaza la hipótesis nula, y por lo tanto si hay asociación lineal entre los
rendimientos sobre el activo y los préstamos sobre depósitos.
ˆ1 ˆ 0.47
c) Se sabe que T  por lo tanto S ˆ  1 
S ˆ 1 T 6.81
1
EJEMPLO . Una revista explica los tiempos de estudio de una empresa de transportes para
reducir el tiempo de entrega y para ello exige a los empleados que estudien los mapas de la
ciudad y aprendan el sistema de carreteras. Los tiempos de estudio y entrega se dividieron en
horas. Se supervisa a 15 horas en relación con el tiempo dedicado a estudiar el mapa y el
empleado en su única entrega. Los resultados son los siguientes:
X i  36.4 Y  22.6
i X i
2
 90.04
Yi
2
 41.78  X Y  51.37
i i n  15
X : Es el tiempo dedicado a estudiar el mapa (en horas)
Y : Es el tiempo, en horas, de entrega.
Se pide:
a) Suponiendo que existe una relación lineal entre las variables; estimar los parámetros del
modelo e interpretar.
Con base en la información disponible, se encuentra que X  2.4266, Y  1.5066 y por lo tanto
S xy   X i Yi  nXY  51.37  15(2.4266)(1.5066)  3.4469

S xx   X i  nX 2  90.04  15(2.4266) 2  1.7142
S yy   Yi  nY 2  41.78  15(1.506) 2  7.7595
y como la ecuación de regresión estimada es entonces Yi  0  1 x   i , se requiere encontrar

los parámetros ˆ1 y ˆ0 , donde
S xy 3.6695
ˆ1    2.0108
S xx 1.4665
ˆ0  Y  ˆ1 X  1.5066  ( 2.0108)(2.4266)  6.3854
La ecuación de regresión estimada es Yˆ  6.3854  2.0108 X i
Los parámetros se interpretan así:
̂1  2.0108 , es decir, por cada hora de estudio se espera que el tiempo promedio de entrega
se disminuya en 2.5 horas.
̂0  6.3854 , si los mapas no se estudian el tiempo promedio de entrega será 6.3854 horas.
b) Probar si el intercepto es significativo en el modelo

La prueba entonces se establece así
H 0 : 0  0
H a : 0  0
Para esto se utiliza el siguiente estadístico de prueba:

ˆ0 ˆ0
T 
S
1 X2
 S
X i
2
n S xx nS xx
Considerando un   0.05 , se encuentra que t0.025,13  2.160 .

S yy  ˆ1S xy 7.7595  (2.0108)(3.4469)
S2    0.0637 luego S  0.2524
n2 13
Reemplazando este valor en el estadístico de prueba se obtiene que

ˆ0 6.3854
T   13.519
S
X i
2
0.2524
90.94
nS xx 15(1.7142)
Por lo tanto se rechaza la hipótesis nula, y se acepta la alternativa, es decir, el intercepto es

significativo para el modelo.
c) Probar si la pendiente es significativa en el modelo.

La prueba se establece así,
H 0 : 1  0
H a : 1  0
El estadístico de prueba que se utiliza en este caso es,

ˆ1 2.0108
T   10.43
S S xx 0.2524 1.7142
Se rechaza la Hipótesis nula, es decir, el tiempo dedicado a estudiar el mapa tiene una relación
lineal con el tiempo de entrega.
d) Construir e interpretar un intervalo de confianza del 95% para 1
ˆ1  t( 2,n 2)

S
 2.0108 
 2.160  0.2524 
S xx 1.7142
2.4277  1  1.5944
Con una confiabilidad del 95% se puede decir que por cada hora de estudio el tiempo promedio
de entrega se va a reducir entre 1.59 y 2.92 horas.
e) Suponga que un empleado dedicó 2 horas a estudiar el mapa, construir e interpretar un

intervalo de confianza del 95% para la esperanza de Y
X*  2
1 X  X 
* 2
 ˆ
0  ˆ1 X *
  t( 2, n 2) S
n

S xx
 2  2.4266 
2
1
 6.3854  2.0108(2)   (2.160)(0.2524) 
15 1.7142
Luego 2.1373  E Y   2.589 , es decir, con una confianza del 95% se puede afirmar que si se
dedican 2 horas de estudio al mapa, el tiempo promedio de entrega va a estar entre 2.13 y 2.58
horas.
f) Calcular e interpretar el coeficiente de determinación y el coeficiente de correlación.

El coeficiente de determinación es
SSR ˆ1S xy (2.0108)(3.4469)
R2     0.8932
SST S yy 7.7595
y significa que la variabilidad que existe en el tiempo de entrega es explicada en 89.32% por la
variabilidad en el tiempo dedicado a estudiar el mapa.
El coeficiente de correlación
ˆ1S xy
r  R 2  0.9450
S yy
r  0.9450
La correlación que existe entre las variables es inversa pues entre mayor sea tiempo de estudio
menor es el tiempo de entrega y de igual manera, entre menor sea el tiempo de estudio mayor
será el tiempo de entrega.
Lo anterior indica entonces que existe una relación lineal fuerte entre el tiempo de entrega y el
tiempo de estudio.
EJEMPLO. Para una muestra aleatoria de ocho semanas el dueño de una licorera está
interesado en medir el efecto del precio de una botella de whiskey escocés sobre la cantidad
vendida. Sea Y las ventas por semanas (medidas en número de cajas) y X el precio (dado en
miles de pesos). Se dispone de la siguiente información:
X i  15.64 Y  162.3
i X i
2
 30.72
Y i
2
 3822.35  X Y  308.80
i i n8
Para este caso se pide:
a) Estimar la regresión lineal de Y sobre X , e interpretar los parámetros.
Con base en la información disponible, se encuentra que X  1.955 y Y  20.2875 y además,
S xy   X iYi  nXY  308.80  8(1.955)(20.2875)  8.4965

S xx   X i  nX 2  30.72  8(1.955)2  0.1438
S yy  Yi  nY 2  3822.35  8(20.2875)2  529.68875
con estos resultados se encuentra
S xy 8.4965
ˆ1    59.08553547
S xx 0.1438
ˆ0  Y  ˆ1 X  20.2875  (59.08553547)(1.955)  135.7997218
Como la ecuación de regresión estimada es Ŷ  ˆ0  ˆ1 X entonces
Yˆ  135.7997218  59.08553547 X i
Los parámetros se interpretan de la siguiente manera.
̂1  59.08553547 Por cada mil pesos que se aumente el precio del whiskey se espera que la
cantidad vendida de cajas de whiskey se disminuya en 59 cajas.
ˆ0 = 135.7997218. Si el precio del whiskey no aumenta se espera que la cantidad promedio de
cajas vendidas sea de 135 cajas.
b) Probar si el precio de una botella de whiskey ayuda a explicar la variabilidad que hay en las
ventas por semana y el precio.
La prueba se establece así
H 0 : 1  0
H a : 1  0
ˆ1  0
El estadístico de prueba que se utiliza en este caso es T 
S S xx
S yy  ˆ1S xy 529.68875  ( 59.08553541)( 8.4965)
S2  
n2 6
S  4.611416
2
S S 2  2.1474
Reemplazando este valor, en el estadístico de prueba, se obtiene que
ˆ1  0 59.08553547
T   10.4339
S S xx 2.1474 0.1438
Recuerde que se rechaza la hipótesis nula si T  t 2,v  , y como t 0.025,6  2.447 entonces
10.4339  2.447 y por lo tanto se rechaza la hipótesis nula, es decir, el precio si es significativo
para explicar la variabilidad de las ventas semanales.
c) Probar si existe una relación uno a uno entre las ventas por semana y el precio.
La prueba se establece como
H 0 : 1  1
H a : 1  1
ˆ1  1
El estadístico de prueba que se utiliza en este caso es T  y con la información
S S xx
disponible se efectúan los siguientes cálculos
S yy  ˆ1S xy 529.68875  (59.08553541)(8.4965)

S2  
n2 6
S  4.611416
2
S  S2
S  2.1474
reemplazando este valor en el estadístico de prueba se encuentra que

ˆ1  1 59.08553547  1
T   10.612
S S xx 2.1474 0.1438
Se rechaza la hipótesis nula puesto que t 0.025,6  2.447 y 10.612  2.447 , es decir, no existe
una relación uno a uno entre el precio y la cantidad vendida semanalmente
d) Hallar e interpretar un intervalo de confianza del 95% para 1

S
Al reemplazar en la forma compacta ˆ1  t( 2, n  2) , se obtiene que
S xx
59.08553547 
 2.447  2.1474 
0.1438
es decir
45.2285  1  13.8569
Lo anterior significa que con una confiabilidad del 95% se puede decir que por cada mil pesos
que aumente el precio del whiskey, el número de cajas vendidas se va a reducir entre 13.85 y
45.2285
e) Calcular e interpretar el coeficiente de determinación y el coeficiente de correlación.

El coeficiente de determinación está dado por,
SSR ˆ1S xy (59.08553547)(8.4965)

R2     0.947764611
SST S yy 529.68875
Es decir la variabilidad que existe en el número de cajas vendidas es explicada en un 94.77%

por la variabilidad el precio.
El coeficiente de correlación está dado por,
ˆ1S xy
r  R 2  0.973532028
S yy
r  0.973532028
Luego la correlación que existe entre las variables es inversa. Además existe una relación lineal
fuerte entre el precio y las cantidades vendidas
f) Si el precio de una botella es $2.100. Hallar e interpretar un intervalo de confianza del 95%
para la esperanza de Y
Se tiene que X *  2,1 y en forma compacta
1 X  X 
* 2
 ˆ  ˆ X 
0 1
*
 t( 2,n 2) S
n

S xx
Al sustituir queda
 2.1  1.955
2
1
1335.79997218  (59.08553547)(2.1)   (2.4447)(2.1474) 
15 0.1438
8.98409  E Y   14.45609
Con una confianza del 95% se afirma que si el precio de la botella de whiskey es de $2.100, la
cantidad de cajas vendidas va a estar entre 8.98409 y 14.45609 unidades.
EJEMPLO. Considere las siguientes variables, valor total de las acciones de los bancos
colombianos que cotizan en bolsas (Y) y su valor contable (X), ambas en millones de pesos.
a) Realizar el gráfico de dispersión.
VALOR_ACCIONES vs. VALOR_CONTABLE

900000
800000
700000
VALOR_ACCIONES
600000
500000
400000
300000
200000
100000
0
0 100000 300000 500000 700000
VALOR_CONTABLE
Analizando el gráfico anterior se deduce que existe una posible relación lineal entre el valor
total de las acciones con el valor contable.
b) Suponiendo que existe una relación lineal en X y Y , estimar por mínimos cuadrados la
ecuación de regresión e interpretar la pendiente.
Variable Dependiente: ACCIONES
Método: Mínimos Cuadrados
Observaciones incluidas: 20
Variable Coeficiente Error Estándar Estadístico t Prob.
PRECIO 1.219038 0.127035 9.596057 0.0000
C 29420.48 30847.96 0.953725 0.3529
R -cuadrado 0.836489 Media variable Dependiente 210521.8
R- cuadrado ajustado 0.827405 Desv. Est. variable dependiente 262672.7
Desv. Est. de la regresión 109126.2 Criterio de Akaike 26.13304
Suma residuos cuadrados 2.14E+11 Criterio Schwarz 26.23261
Log likelihood –259.3304 Estadístico F 92.08431
Estadístico Durbin-Watson 1.671826 Prob (estadístico F) 0.000000
Yî  ˆ0  ˆ1 X i  29420.48  1.219038 X i

Impacto marginal: ˆ = 1,219038 1
Por cada millón de pesos que aumente el valor contable del banco, aumentará un 1.219 millones
de pesos el valor de sus acciones en bolsa.
c) Pruebe si la pendiente es significativa.

H 0 : 1 = 0
H a : 1  0
ˆ1
T = = 9.596057
S / S xx
S
Sˆ 1 = = 0.127035
S xx
prob = 0.00 < 0.05 se rechaza H 0
El valor contable de las acciones ayuda a explicar la variabilidad que existe en el valor de las
acciones.
d) Pruebe si existe una relación uno a uno entre las variables.

H 0 : 1 = 1
H a : 1  1
ˆ1 - 1
T = = 9.5960
S / S xx
prob = 0.00
T > t (0.025 , 18) = 2.101
9.5960 > 2.101
Se rechaza H 0 , significa que no existe una relación uno a uno entre el valor contable y el valor
total de las acciones.
e) Calcule e interprete un intervalo de confianza del 90% para la pendiente.

S S
ˆ1 - t(  /2 , n-2) < 1 < ˆ1 + t( /2 , n-2)
S xx S xx
t (0.025 , 18) = 2,101
0,9521 < 1 < 1,4859

Con una confianza del 90% si el valor contable se incrementa en un millón de pesos se espera
que el valor total de las acciones se incremente entre 0,9521 y 1,4859 millones de pesos.
f) Pruebe si el modelo es significativo.

H 0 : El modelo no es significativo.
H a : El modelo es significativo.
F  SSR / S 2  92, 0843 , Prob = 0,00 < 0,05

Se rechaza H 0 , lo que significa que el modelo propuesto es significativo.
g) Interpretar el coeficiente de determinación y el coeficiente de correlación.

Coeficiente de determinación: R2  0,836489
La variabilidad que hay en el valor total de las acciones de los bancos colombianos es explicada
aproximadamente en un 83% por la variabilidad en el valor contable de las acciones.
Coeficiente de correlación
r  0,8364
r   0, 9145
r  0,8
Existe una relación lineal fuerte entre el valor contable de las acciones y el valor total de las
acciones.
h) Si el valor contable de un banco es 18315 millones de pesos, calcular e interpretar el valor de

sus acciones de bolsa.
X  18315 millones de pesos
Yˆ  ˆ  ˆ X  29428, 48  1, 219030(18315)  51747,16
i 0 1 i
Cuando el valor contable de las acciones es 18315 millones de pesos se espera que el valor de
las acciones en la bolsa sea de 51747 millones de pesos.

Regresión Lineal Simple

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Regresión Lineal Simple

Cargado por

Copyright:

Formatos disponibles

REGRESIÓN LINEAL SIMPLE

El modelo de regresión lineal que vamos a considerar se divide en el modelo de regresión

REGRESIÓN LINEAL SIMPLE

Los parámetros  0 y 1 de la ecuación anterior son desconocidos y representan el intercepto

aumentar el precio y también predecir el valor de la cantidad demandada, dado un precio. El

A continuación se presentan los datos de la demanda mensual de televisores y su precio unitario

1 60000 5124 11 75000 4386

2 64000 5045 12 76000 4213

3 65000 4905 13 78000 4040

4 63000 5030 14 82000 3875

5 66000 4612 15 83000 3124

6 70000 4531 16 83500 2890

7 80000 3273 17 86000 2757

8 76000 4227 18 80000 2220

9 70000 4608 19 90000 2780

10 74000 4490 20 91000 2364

Se pretende entonces determinar si los precios de televisores pueden ayudar a determinar la

Diagrama de dispersión Y vs. X Se observa que la relación entre las dos

Donde  i es una componente aleatoria de error o también llamada variable aleatoria no

En la práctica, se dispone de una muestra aleatoria de n observaciones de la variable Y

SUPUESTOS DEL MODELO CLÁSICO DE REGRESIÓN LINEAL

1) El modelo de regresión es lineal en los parámetros, es decir, el término Regresión Lineal

4) La varianza (o dispersión) de la perturbación estocástica es la misma en todas las

La expresión anterior establece entonces que la varianza de cada εi , es algún número

Por lo tanto la distribución de probabilidad de la variable endógena es:

5) La perturbación estocástica se distribuye normalmente. Es decir  i ~ N (0,  2 )

6) Los errores son incorrelacionados. Las variables aleatorias  i y  j son estadísticamente

7) El número de observaciones debe ser mayor que el número de parámetros a estimar. De

ESTIMACIÓN DE LOS PARÁMETROS POR MÍNIMOS CUADRADOS

OBTENCIÓN DE LOS ESTIMADORES

Derivando ahora parcialmente con respecto a 1 , e igualando a cero, se obtiene

De la ecuación (1.3) se tiene que 0  Y  1 X . Este resultado se sustituye en la ecuación (1.4)

y finalmente queda la siguiente expresión

Yˆi  ˆ0  ˆ1 X i (1.6)

Ahora como el denominador en la ecuación (1.5) es la suma corregida de cuadrados de las Xi ,

y el numerador es la suma corregida de los productos cruzados de X i y Yi , denotada S x y , es

entonces ˆ1 se puede escribir en forma compacta como,

EJEMPLO. Para la muestra de la demanda mensual de televisores y su precio unitario (en

Variable Dependiente: DEMANDA

Variable Coeficiente Error Estándar Estadístico t Prob.

R -cuadrado 0.821408 Media variable Dependiente 3924.700

Desv. Est. de la regresión 411.3903 Criterio de Akaike 14.97160

Suma residuos cuadrados 3046355. Criterio Schwarz 15.07117

Log likelihood –147.7160 Estadístico F 82.78862

Estadístico Durbin-Watson 1.594529 Prob (estadístico F) 0.000000

De esta forma, ̂0  11086.19 y ˆ1 =  0.094697

Entonces, la ecuación ajustada se puede escribir como:

Yˆi  11086.19  0.094697 X i

De esta forma, sí por ejemplo X i  X  75625 entonces,

Yˆi 11086.19  0.094697  75625  3924.7

Que coincide con el valor de Y  3924.7

PROPIEDADES DE LOS ESTIMADORES POR MÍNIMOS CUADRADOS

1) ˆ1 es un estimador insesgado de 1 . Es decir, E ( ˆ1 )  1

2) ̂ 0 es un estimador insesgado de  0 . Es decir, E ( ˆ0 )  0

De los resultados anteriores se tiene entonces que

En donde  2 es desconocida y se estima por medio de datos muestrales.

Un estimador insesgado de  2 es S 2 , siendo

INFERENCIA PARA LOS PARÁMETROS DEL MODELO

Al estudiar la recta de regresión poblacional

determinar dos números positivos  y  con 0    1 , tal que la probabilidad de que el

El intervalo (ˆ1   , ˆ1   ) se llama intervalo de confianza; 1   se denomina coeficiente de

P(ˆ1    1  ˆ1   )  0.95

y se lee: la probabilidad de que 1 esté en el intervalo (ˆ1   , ˆ1   ) es 0.95 o 95%