Está en la página 1de 44

SEMANA 10

Coeficiente de Determinacin Parcial

Coeficiente de Determinacin Parcial

Los coeficientes son una medida de la porcin de la variacin


en la variable dependiente que es explicada por cada variable
explicativa, mientras se controla o se mantiene constante a las
dems variables explicativas.

As pues, en un modelo de regresin mltiple con dos


variables explicativas tenemos:

y tambin

en la que:
SSR(X1 / X2) = suma de cuadrados de la contribucin de la
variable X1 al modelo de regresin dado que la variable X2
ha sido incluida en el modelo.
SST = suma total de cuadrados para Y
SSR(X1 y X2) = suma de cuadrados de regresin cuando las
variables X1 y X2 estn incluidas en el modelo de regresin
mltiple.
SSR(X2 / X1) = suma de cuadrados de la contribucin de la
variable X2 al modelo de regresin dado que la variable X1
ha sido incluida en el modelo.

Mientras que en un modelo de regresin mltiple que


contiene varias (P) variables explicativas, tenemos:

Para nuestro problema sobre el consumo de petrleo para


calefaccin podemos calcular

El coeficiente de determinacin parcial de la variable Y


con X1, mientras se mantiene constante X2 puede
interpretarse como que, para una cantidad fija
(constante) de aislamiento en el tico, 95.61% de la
variacin en el consumo de petrleo para calefaccin
durante enero puede explicarse por la variacin en la
temperatura atmosfrica diaria promedio en dicho mes.

El coeficiente de determinacin parcial de la variable Y


con X2, mientras se mantiene constante X1
puede
interpretarse como que, para una temperatura atmosfrica
diaria promedio dada (constante), 85.88% de la variacin
en el consumo de petrleo para calefaccin durante enero
puede ser explicada por la variacin en la cantidad de
aislamiento.

El Modelo de Regresin Curvilneo


En nuestro anlisis de la regresin simple y en el de
regresin mltiple, hemos supuesto que la relacin entre Y
y cada variable explicativa es lineal.
Sin embargo, existen varios tipos diferentes de relaciones
entre variables. Una de las relaciones no lineales ms
comunes es la relacin polinomial curvilnea entre dos
variables en la que Y aumenta (o disminuye) con una
rapidez variable para diferentes valores de X.

Este modelo de una relacin polinomial entre X y Y puede


expresarse como:
en la que:

Este modelo de regresin es parecido al modelo de


regresin mltiple con dos variables explicativas, excepto
en que la segunda variable explicativa, en este caso, es
justamente el cuadrado de la primera variable.

La ecuacin de regresin para el modelo polinomial


curvilneo con una variable explicativa (X1) y una
variable dependiente (Y) es:

(1)

Un planteamiento alternativo al modelo de regresin


curvilneo expresado en la ecuacin (1) consiste en centrar
los datos mediante la sustraccin de la media de la variable
explicativa de cada valor del modelo.
Este modelo de regresin centrada se presenta en la
siguiente ecuacin:
(2)

Matemticamente hablando, la ecuacin (1) y la ecuacin


(2) son equivalentes.

La diferencia entre los dos mtodos se presenta en los


trminos correspondientes a la interseccin y al efecto
lineal.

Bsqueda de los Coeficientes de Regresin y


Prediccin de Y
Con el fin de ilustrar el modelo de regresin curvilneo,
suponga que el departamento de mercadotecnia de una
cadena grande de supermercados desea estudiar la
flexibilidad de precios de los paquetes de rasuradoras
desechables. Se seleccion una muestra aleatoria de 15
tiendas con igual afluencia de clientes y colocacin de
artculos (es decir, junto a las cajas registradoras).

El nmero de paquetes vendidos y el precio en cada tienda


se presentan en la siguiente tabla:
TABLA: Ventas y precios de paquetes de rasuradoras desechables para una
muestra de 15 tiendas
Ventas

Precio (ctvos.)

Ventas

Precio (ctvos.)

142
151
163
168
176
91
100
107

79
79
79
79
79
99
99
99

115
126
77
86
95
100
106

99
99
119
119
119
119
119

Con el propsito de investigar la seleccin del modelo


adecuado que representa la relacin entre precio y ventas,
se grafic un diagrama de dispersin en la siguiente figura:
FIG.: Diagrama de dispersin del precio (X) y las ventas (Y)

Un examen ms detallado de ste nos indica que la


disminucin de las ventas se nivela con un aumento de
los precios

Por consiguiente, parece que podra ser ms apropiado


utilizar un modelo curvilneo para estimar las ventas
basndose en el precio, en lugar de usar un modelo lineal.

Ventas(Y)
142
151
163
168
176
91
100
107
115
126
77
86
95
106

Precio(X1i)
79
79
79
79
79
99
99
99
99
99
119
119
119
119

2 ( X 1i )

Precio
6241
6241
6241
6241
6241
9801
9801
9801
9801
9801
14161
14161
14161
14161

( X1i X1 )

-20
-20
-20
-20
-20
0
0
0
0
0
20
20
20
20

( X1i X1 )2

400
400
400
400
400
0
0
0
0
0
400
400
400
400

En la siguiente Fig. se presenta el resultado parcial obtenido


con el paquete MINITAB para los datos de nuestro ejemplo,
utilizando el modelo centrado (ecuacin 2).
Anlisis de Regresin
La ecuacin de regresin es:
Ventas(Y) = 108 - 1.68 (X1i - media) + 0.0465 (X1i - media)sq
Predictor
Constant
(X1i - m
(X1i - m
S = 12.87

Coef

107.800
-1.6800
0.04650

StDev
5.756
0.2035
0.01762

R-Sq = 86.2%

T
18.73

-8.26
2.64

P
0.000
0.000
0.022

R-Sq(adj) = 83.9%

Anlisis de Varianza
Source
Regression
Residual Error
Total

DF
2
12
14

SS
12442.8
1987.6
14430.4

MS

6221.4
165.6

F
37.56

P
0.000

En la figura observamos que:


b0" 107.8

b1" 1.68

b11 0.0465

Por consiguiente, el modelo curvilneo centrado puede


expresarse como:

Para interpretar los coeficientes vemos que las ventas


disminuyen con un aumento de los precios; sin embargo,
observamos tambin que estas disminuciones en las ventas
se nivelan o se reducen al aumentar el precio.
Esto se puede ver al predecir las ventas promedios para
paquetes con precios de 79 centavos, 99 centavos y 119
centavos ($1.19) Utilizando nuestra ecuacin de regresin
curvilnea

para X1i 79 ,tenemos

para X 1i 99 , tenemos

para X1i 119 , tenemos

As pues, observamos que se espera que una tienda que


vende las rasuradoras en 79 centavos venda 52.2 paquetes
ms que una tienda que vende las rasuradoras en 99
centavos.
Pero se espera que una tienda que las vende a 99 centavos
venda solamente 15 paquetes ms que una tienda que las
venda a $1.19.

Diagrama de dispersin que representa la relacin


curvilnea entre el precio (X) y las ventas (Y)

Prueba de la Significacin del Modelo Curvilneo


Ahora que el modelo curvilneo ha sido ajustado a los
datos, podemos determinar si existe una relacin
curvilnea significativa entre las ventas, Y, y el precio, X.
De manera parecida a la regresin mltiple, las hiptesis
nula y alternativa pueden establecerse como
H 0 : 1 11 0

(no existe relacin entre X1 y Y)

H1 : 1 y/o 11 0

(el ltimo coeficiente de regresin no es igual a cero)

La hiptesis nula puede ser probada utilizando una prueba


F.
Utilizando los resultados obtenidos para nuestro problema
mediante el paquete MINITAB, se tiene:

Si se selecciona un nivel de segnificacin de 0.05, tenemos


que, para 2 y 12 grados de libertad, el valor crtico de la
distribucin F es de 3.89

Se llega a la conclusin de que existe una relacin


curvilnea significativa entre las ventas y el precio
de las rasuradoras.

En el anlisis de regresin curvilnea, el coeficiente de


determinacin mltiple puede calcularse con la ecuacin
siguiente:

De los resultados del paquete MINITAB, tenemos:

SSR = 12,442.8 y SST = 14,430.4


As pues,

Este coeficiente de determinacin mltiple, cuyo valor se


calcul en 0.862, puede interpretarse como que el 86.2%
de la variacin en las ventas puede ser explicado por la
relacin curvilnea entre las ventas (Y) y el precio (X).
Tambin se puede calcular un coeficiente de
determinacin ajustado para tomar en cuenta el nmero
de variables explicativas y el nmero de grados libertad.
En nuestro modelo de regresin curvilneo, P = 2,
puesto que tenemos dos variables independientes

Por consiguiente, para las ventas de rasuradoras, tenemos:

Prueba del Efecto Curvilineal


Al utilizar un modelo de regresin para examinar una relacin
entre dos variables, nos gustara ajustar no slo el modelo
ms preciso, sino tambin el ms sencillo que pueda expresar
dicha relacin.

En consecuencia, resulta importante examinar si existe una


diferencia significativa entre el modelo curvilneo

y el modelo lineal

Estos dos modelos pueden ser comparados mediante la determinacin del efecto de regresin que se tiene al agregar
2

el trmino curvilneo, dado que el trmino lineal ya ha sido incluido, esto es, SSR( X1 / X1 ).

Podemos utilizar la prueba t para el coeficiente de regresin con el fin de determinar


si cada variable particular hace una contribucin significativa al modelo de regresin

De acuerdo con el resultado obtenido con el paquete MINITAB, observamos que


el error estndar de cada coeficiente de regresin y su correspondiente estadstica t
estn disponibles.

Podemos probar la significacin de la contribucin del


efecto curvilneo con las siguientes hiptesis nula y
alternativa:
H0 : El incluir el efecto curvilneo no mejora significativamente el modelo ( ( 11 0) .

H1 : El incluir el efecto curvilneo mejora significativamente el modelo ( 11 0) .

Para nuestros datos:

Si se selecciona un nivel de significacin de 0.05,


encontramos que con doce grados de libertad, los valores
crticos son 2.1788 y +2.1788

Puesto que t = 2.64 > t12 =2.1788, nuestra decisin sera


rechazar H0 y llegar a la conclusin de que el modelo
curvilneo es significativamente mejor que el modelo lineal
en la representacin de la relacin entre las ventas y los
precios.

Prueba del Efecto Lineal

Como en el caso del efecto curvilneo, podemos utilizar la


prueba t para determinar la contribucin del efecto lineal
dado que el efecto curvilneo ya se encuentra incluido en el
modelo.
Para nuestros datos,

Las hiptesis nula y alternativa para probar la contribucin


del efecto lineal al modelo de regresin son:
H 0 : 1' 0 (La inclusin del efecto lineal no mejora el modelo de efecto curvilneo.)

H1 : 1' 0 (La inclusin del efecto lineal mejora el modelo de efecto curvilneo.)
Si se selecciona un nivel de significacin de 0.05,
encontramos que con doce grados de libertad, los valores
crticos son 2.1788 y +2.1788

Modelos de Variables Ficticias


En nuestro anlisis de los modelos de regresin mltiple
efectuada hasta el momento, hemos supuesto que cada
variable explicativa (o independiente) es numrica.
Sin embargo, se tienen muchos casos en los que se necesita
tomar en cuenta variables categricas como parte del proceso
de desarrollo del modelo.
Por ejemplo, si se tiene los resultados de una Encuesta de
satisfaccin de los empleados en una empresa, y utilizamos la
antigedad (en nmero de aos) en la planta de trabajo para
desarrollar un modelo para predecir el ingreso.

Adems, podemos desear tambin incluir el efecto de


factores como el sexo de los trabajadores, si los
individuos participan en decisiones presupuestales, si
toman parte en las decisiones que afectan su trabajo y si
estn orgullosos de estar trabajando para la organizacin.
El uso de variables ficticias es el vehculo que nos
permite tomar en consideracin variables categricas
como parte del modelo de regresin.
Si una variable independiente categrica tiene dos
categoras, entonces solamente se necesitar una
variable ficticia para representar a las dos categoras.

La variable ficticia particular (Xd) se define como:

Examinemos un modelo para predecir el ingreso de los


empleados basndonos en la antigedad en la planta de
trabajo (X1) y si el individuo participa o no en decisiones
presupuestales.

Una variable ficticia correspondiente a la participacin en


decisiones presupuestales (X2) se define como:

Suponiendo que la pendiente entre el ingreso y la


antigedad en la planta de trabajo es la misma para ambos
grupos, el modelo de regresin puede establecerse como:
(1)

Yi ingreso correspondiente al empleado i.

Usando la muestra de 57 empleados cuya ocupacin est


clasificada como tcnica de ventas, se ajust el modelo
establecido en la ecuacin (1).

Los valores de los coeficientes de regresin de muestra


resultantes (b0 , b1 y b2) , de los errores estndar y de t
se resumen en la siguiente tabla:

TABLA: Resumen de los Resultados para el Modelo de


Variable Ficticia

Coeficiente de regresin
Nombre de la variable

Constante
Aos
Participacin
presupuestales

en

Error estndar

13.936
0.7314

3.850
0.1759

3.62
4.16

8.027

3.341

2.40

decisiones

Observe lo siguiente:
1. Manteniendo constante el efecto de si el individuo
participa en decisiones presupuestales, se estima que
cada ao adicional de antigedad en la planta de trabajo
se obtiene en promedio $731.40 en el ingreso del
empleado.
2. b2 mide el efecto sobre el ingreso de haber participado
en decisiones presupuestales (X2 = 1) en comparacin con
no haber participado en tales decisiones (X2 = 0). Por lo
tanto, manteniendo la antigedad en la planta de trabajo
constante, estimamos que un empleado que participa en
decisiones presupuestales tendr, en promedio, un ingreso
de $8,027.00 por encima de alguien que no participa en
dichas decisiones

Utilizando los resultados de la tabla anterior, el modelo para


estos datos puede establecerse como:

Para empleados que no participan


presupuestales el modelo se reduce a:

en

decisiones

puesto que X2 = 0
Para empleados que s
participan en decisiones
presupuestales el modelo se reduce a:

puesto que X2 = 1

También podría gustarte