CAPITULO
114.
Analisis de regresion
con dos variables
Esau
-1. Visién panorémica de los modelos lineales
.2. Modelo de regresién lineal
. Estimadores de coeficientes por e! método
de minimos cuadrados
Caloulo por ordenador de coeficientes
de regresion
El poder explicativo de una ecuacién
de regresién lineal
El coeticiente de determinacién,
a
118.
PITULO
Inferencia estadistica: contrastes de
hipétesis @ intervalos de confianza
Contraste de hipdtesis del coeficiente
de la pendiente poblacional utilizando
la distribucién F
. Prediccién
. Analisis de correlacion
Contraste de hipstesis de la correlacién
Medida beta del riesgo financiero
Analisis grafico
Introduccién
Hasta ahora hemos centrado la atencién en el andlisis y la inferencia relacionados con una unica
variable. En este capitulo, extendemos nuestro andlisis a las relaciones entre variables. Nuestro
anélisis se basa en las relaciones descriptivas y utiliza los diagramas de puntos dispersos y los
coeficientes de covarianza/correlacién desarrollados en el Capitulo 2. Suponemos que el lector es-
1 familiarizado con ese capitulo.
En el andlisis de los procesos empresariales y econémicos se utilizan a menudo las relaciones
entre variables. Estas relaciones se expresan en términos matematicos de la forma siguiente:
y= fay
donde la funcién puede adoptar formas lineales y no lineales. En muchas aplicaciones, la forma de
la relacién no se conoce exactamente. Aqui presentamos analisis basados en modelos lineales de-
sarrollados utilizando la regresién por minimos cuadrados. En muchos casos, las relaciones linea-
les constituyen un buen modelo del proceso. En otros casos, nos interesa una parte limitada de una
relacion no lineal a la que podemos aproximamos mediante una relacion lineal, En el Apartado
12.7, mostramos que algunas importantes relaciones no lineales también se pueden analizar util
zando el andlisis de regresién. Por tanto, los métodos de regresién tienen una amplia variedad de
aplicaciones, entre las que se encuentran numerosas aplicaciones en el mundo empresarial y en el
andlisis econémico, como indican los siguientes ejemplos:434 —Estadistica para administracion y economia
‘+ El presidente de Materiales de Construccién, S.A., fabricante do placas de yeso, cree que la
cantidad anual media de placas de yeso vendidas, Y, en su regién es una funcién lineal del
valor total de los permisos de edificacién expedidos, X, durante el afio anterior.
‘+ Un vendedor de cereales quiere saber cémo afecta la produccién total al precio por tonelada
para poder desarrollar un modelo de prediccién utilizando datos histéricos.
+ Los analistas del departamento de marketing nocesitan saber cémo afecta el precio de la ga-
solina, X, a las ventas totales de gasolina, ¥. Utiizando datos semanales sobre los precios y
las ventas, planea desarrollar un modelo lineal que muestre cuanto varian las ventas cuando
varia el precio.
Cada una de estas relaciones se puede expresar como un modelo lineal,
Y= Ry + BX
donde ji, y 6, son coeficientes numéricos para cada modelo especitico
Con la aparicion de muchos y buenos paquetes estadistioos y de hojas de calculo como Excel,
hoy es posible para casi todo e! mundo calcular los coeticientes y otros estadisticos de regresién
necesarios. Desgraciadamente, no es posible interpretar y utilizar correctamente estos resultados
obtenidos por ordenador si no se comprende la metodologia det andiisis de regresién. En este capi-
tulo y en los dos siguientes, el lector aprender algunas ideas fundamentales que lo ayudarén a
utilizar el andlisis de regresién,
11.1. Visi6n panoramica de los modelos lineales
En el Capitulo 2, vimos como se puede describir la relacién entre dos variables utilizando diagramas de
Puntos dispersos para tener una imagen de la relacién y coeficientes de correlacién para tener una medida
numérica. En muchos problemas econémicos y empresariales, se necesita una relacién funcional especi
para obtener resultados numéricos.
«A un gerente le gustaria suber qué nivel medio de ventas cabe esperar si el precio se fija en 10 $ por
tnidad
se emplean 250 trabajadores en una fabrica,zeudmtas unidades se pueden producir en un dia me-
dio?
im pats en vias de desarollo aumenta su produccin de frilizantes entun mill6n de tonelada,
smo cabe esperar que aumente la produceion de cereales?
En muchos casos, podemos calcular aproximadamente las relaciones funcionales deseadas mediante una
ecuacién lineal:
Y= fy+ BX
donde Yes la variable dependiente o endégena, X es la variable independiente o exdgena, fy es la ordenada
en el origen y fi es la pendiente de ta recta, 0 sea, la variacién que experimenta Y por cada variacién
unitaria de X. La Figura 11.1 es un ejemplo de un modelo de regresidn simple representativo que muestra el
riimero de mesas producidas, Y, utilizando diferentes cantidades de trabajadores, X. Cuando se desarrolla el
método de regresién por minimos cuadrados, se parte del supuesto de que a cada valor de X le corresponde
un valor medio de ¥ debido a la retacién lineal subyacente en el proceso estudiado. El modelo lineal calcula
la media de ¥ para cada valor de X’y es la base para obtener muchas relaciones econdmicas y empresariales,
entre las que se encuentran las funciones de demanda, las funciones de produccién, las funciones de consu-
‘mo y las previsiones de ventas.
El coeficiente de la pendiente, f, ¢s extraordinariamente importante para muchas aplicaciones empre-
sariales y econémicas, ya que indica la variacién que experimenta la produccién o variable endégena por
‘cada variacién unitaria que experimenta un factor 0 variable exégena, La relacién de la Figura 11.1
= 13,02 + 2,545Analisis de regresién con dos variables 438,
Fitted Line Plot
9 = 1802+ 2.545 «
70
60
g
B50
3
3 40
20
20
10 5 20 25 30
Number of Workers
Figura 11.1. Funcién lineal y puntos de datos.
‘muestra que cada trabajador adicional, X, aumenta el nimero de mesas producidas, ¥, en 2,545. La ordena-
da en el origen, ~13,02, ajusta meramente Ia recta de regresiGn hacia arriba o hacia abajo y no tiene nin-
‘in significado real para este resultado de la aplicacidn. Esta ecuacién solo es valida en el rango de X, de
11 a 30, En algunas situaciones, la direccidin de la empresa puede tener buenas razones —ademés de sim-
plemente el modelo de regresién estimado— para creer que la relacién lineal se mantendré por encima 0
por debajo del rango de X (11-30). En esos casos, podria extender el modelo mAs alld del rango de X basin-
dose en sus conocimientos adicionales.
Utilizando el modelo de regresiGn, la direccién puede averiguar si el valor del aumento de la produe-
cidn es mayor que el coste de un trabajador més
Utilizamos regresiones para averiguar cudl es la mejor relacién lineal entre Y y X para una aplicacién
cespecifica. Para eso es necesario hallar los mejores valores de los coeficientes i y fy. Utilizamos los datos
del proceso para calcular «estimaciones» 0 valores numéricos de los coeficientes fy y f. Estas estimacio-
nes by y by— generalmente se calculan utilizando una regresién por minimos cuadrados, técnica que Se
aplica mucho en paquetes estadisticos como Minitab, SPSS, SAS y STATA, asf como en hojas de célculo
como Excel. Se calculan los coeficientes para la recta que mejor Se ajusta, dado un conjunto de puntos de
datos, como se muestra en la Figura 11.1
Regresién por minimos cuadrados
La recta de regresién por minimos cuadrados basada en datos muestr
Fa dyt bye any
+6, 85 la pendiente de la recta, 0 sea, la variacién de y por cada variacién unitaria de x, y se calcula de la
forma siguiente:
Koad «any
bp @8 la ordenada en el origen y se calcula de la forma siguiente:
dy I de a1)