Está en la página 1de 85

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE INGENIERIA INDUSTRIAL

ESTADISTICA INDUSTRIAL
CLASE 07

ANALISIS DE
REGRESIN
MLTIPLE
ING. WILLIAM LEN VELSQUEZ

Introduccin
En clases anteriores se ha tratado el anlisis de regresin

simple que trata de relacionar una variable explicativa


cuantitativa con una variable respuesta cuantitativa.
Todos los temas de esta clase va a servir ahora para
continuar con el caso ms general y de mayor utilidad
prctica, que es la regresin lineal mltiple.
Por regresin lineal mltiple se entiende al
anlisis de regresin lineal pero ahora con ms
de una variable explicativa.

Ing. William len Velsquez

Datos para regresin mltiple


Los datos para regresin lineal simple consisten en pares de

observaciones (xi, yi) de dos variables cuantitativas. Ahora


tendremos mltiples variables explicativas, por lo que la
notacin ser ms elaborada.
Llamaremos xij el valor de la j1 x11 x12 ... x1p y1
sima variable del i-simo sujeto o
2 x21 x22 ... x2p y2
unidad (i=1,2,...,n ; j=1,2,...,p). Los
:
datos se pueden organizar de la
N xn1 xn2 ... xnp yn
siguiente forma en una base:

Donde n es el nmero de casos o tamao muestral y p es el


nmero de variables explicatorias. Esta es una forma de organizar
la base de datos, no importa el orden de las variables.
Ing. William len Velsquez

Modelo de regresin lineal mltiple:


El modelo estadstico de regresin lineal mltiple es:

yi 0 1 xi1 2 xi 2 p xip i
para i= 1, 2, ...,n

La respuesta media es una funcin lineal de las variables


explicatorias:

y 0 1 x1 2 x2 p x p

Las desviaciones son independientes y normalmente distribuidas

con media 0 y desviacin estndar :

i ~ N (0, )
2

Los parmetros del modelo son: y , los coeficiente de regresin y

la estimacin de la variabilidad, es decir son en total (p + 2)


parmetros.

Ing. William len Velsquez

Modelo de regresin lineal mltiple:


Si suponemos que la respuesta media est relacionada

con los parmetros a travs de la ecuacin:

y 0 1 x1 2 x2 p x p
, esto quiere decir que podemos estimar la media de la

variable respuesta a travs de la estimacin de los


parmetros de regresin. Si esta ecuacin se ajusta a la
realidad entonces tenemos una forma de describir cmo
la media de la variable respuesta y vara con las variables
explicatorias .

x1 , x2 ,, x p

Ing. William len Velsquez

Estimacin de los parmetros de regresin


mltiple.
En regresin lineal simple se usa el mtodo de

mnimos cuadrados para obtener estimadores del


intercepto y de la pendiente.
En regresin lineal mltiple el principio es el mismo, pero
necesitamos estimar ms parmetros.
Llamaremos

b0 , b1 ,, b p

parmetros

0 , 1 ,, p

Ing. William len Velsquez

a los estimadores de los

Estimacin de los parmetros de regresin


mltiple
La respuesta estimada por el modelo para la i-sima

observacin es:

y i b0 b1 xi1 b2 xi 2 b p xip

El i-simo residuo es la diferencia entre la respuesta

observada y la predicha:

residuo =

y observado y estimado

ei yi y i

El i-simo residuo =

ei yi b0 b1 xi1 b2 xi 2 b p xip
Ing. William len Velsquez

Estimacin de los parmetros de regresin


mltiple
El mtodo mnimos cuadrados elige los valores de los

estimadores ptimos, es decir, que hacen la suma de


cuadrados de los residuos menor posible.
En otras palabras, los parmetros estimados minimizan
la diferencia entre la respuesta observada y la respuesta
estimada, lo que equivale a minimizar:

y i

La frmula de los estimadores de mnimos cuadrados para


regresin mltiple se complica porque se necesita notacin
matricial, sin embargo estamos a salvo si entendemos el
concepto y dejaremos a a los software hacer los clculos.
Ing. William len Velsquez

Estimacin de los parmetros de regresin


mltiple
El parmetro 2 mide la variabilidad de la respuesta

alrededor de la ecuacin de regresin en la poblacin.


Como en regresin lineal simple estimamos 2 como el
promedio de los residuos al cuadrado:

2
y x

Ing. William len Velsquez

2
i

n p 1

y i

n p 1

Estimacin de los parmetros de regresin


mltiple
La cantidad (n-p-1) son los grados de libertad asociados

con la estimacin de la variabilidad: S2y/x


S2y/x es entonces el estimador de la variabilidad de la
respuesta y, tomando en cuenta las variables
explicatorias xj.
Lo distinguimos de

2
y

yi

n 1

que es la

variabilidad de y sin tomar en cuenta las variables


explicativas xj.
Ing. William len Velsquez

Pruebas de significancia e Intervalos de


confianza para los coeficientes de regresin
Se puede obtener intervalos de confianza y prueba de

hiptesis para cada uno de los coeficientes de regresin


como se hizo en la regresin simple.
Los errores estndar de los estadsticos muestrales tienen
frmulas ms complicadas, as es que nuevamente
dejaremos a un programa de software para que realice
los clculos respectivos

Ing. William len Velsquez

Pruebas de significancia e Intervalos de


confianza para los coeficientes de regresin
Prueba de hiptesis para :
Para probar la hiptesis

H0 : j 0

se usa el test t:

H1 : j 0

bj
EE(b j )

~ t (n p 1)

Donde EE(bj) es el error estndar de bj


Ing. William len Velsquez

Pruebas de significancia e Intervalos de


confianza para los coeficientes de regresin
EE(bj) es el error estndar de bj

Notas:
Se va a dejar al software el clculo del error estndar de bj
Se tendr entonces una prueba de hiptesis asociado a
cada variable explicatoria en el modelo.
Se puede realizar hiptesis de una cola, donde H1: j < 0 o
H1: j >0 , pero lo usual es hacer una prueba
bilateral.
Ing. William len Velsquez

Intervalo de confianza para j


Un intervalo de confianza ( 1 - )*100% para j est dado

por:

bj t

Donde

1
2

(n p 1) EE (b j )

es el percentil apropiado de la distribucin t

con (n-p-1) grados de libertad, EE(bj) es el error estndar


de bj
Ing. William len Velsquez

Tabla de ANOVA para regresin mltiple


La tabla de anlisis de varianza para la regresin mltiple es la

siguiente:

gl
Fuente de variacin Grados de libertad

Modelo

Residuo
Total
Ing. William len Velsquez

p
n-p-1
n-1

SC
Suma de
Cuadrados

CM
Cuadrados Medios

SCMod ( y y )
n

SC Re s ( yi y i ) 2
i 1

SCT yi y
i 1

SCM od
p
SC Re s
n p 1

Tabla de ANOVA para regresin mltiple


La tabla ANOVA es similar a la de regresin simple.
Los grados de libertad del modelo son ahora p en vez de 1,

lo que refleja que ahora tenemos p variables explicatorias


en vez de slo una.
Las sumas de cuadrados representan las fuentes de
variacin. Recuede que la suma de cuadrados total es
igual a la suma de los cuadrados del modelo de regresin
ms la suma de los cuadrados del residuo:
SCT = SCMod + SCRes

Ing. William len Velsquez

Tabla de ANOVA para regresin mltiple

El estimador de la varianza 2 de nuestro modelo est

dado por la media cuadrtica residual


MCRes=SCRes/(n-p-1)

Ing. William len Velsquez

Tabla de ANOVA para regresin mltiple


Estadstico F
La razn entre el cuadrado medio del modelo y el residuo

F MCMod MC Re s
, permite estimar si la relacin entre las variables

explicatorias y la respuesta es significativa.


La hiptesis que prueba el test F es:
H 0 : 1 2 p 0
H 1 : al menos un j no es cero
Ing. William len Velsquez

Tabla de ANOVA para regresin mltiple


La hiptesis nula dice que ninguna de las variables

explicatorias son predictores de la variable respuesta.


La hiptesis alternativa dice que al menos una de las
variables explicatorias est linealmente relacionada con la
respuesta.
Como en regresin simple, valores grandes de F nos dan
evidencia en contra de hiptesis nula.
Cuando H0 es verdadera, el estadstico F tiene
distribucin F de Fisher con (p, n-p-1) grados de libertad.
Los grados de libertad estn asociados a los
grados de libertad del modelo y del residuo en la
tabla ANOVA.

Ing. William len Velsquez

Tabla de ANOVA para regresin mltiple


Recuerde que en regresin lineal simple el test F de la

tabla ANOVA es equivalente al test t bilateral para la


hiptesis de que la pendiente es cero.
Ahora, el test F de regresin mltiple prueba la hiptesis
de que todos los coeficientes de regresin (con excepcin
del intercepto) son cero, hiptesis que no es de mucho
inters.
En el problema de regresin mltiple interesan ms las
hiptesis individuales para cada parmetro asociado a
cada variable explicatoria.

Ing. William len Velsquez

Coeficiente de determinacin (R2)


En regresin lineal simple se vio que el cuadrado del

SCReg
r
SCTotal
2

coeficiente de correlacin era

y se poda interpretar como la proporcin de la

variabilidad de y que poda ser explicada por x. Un


coeficiente similar se calcula en regresin mltiple:

SCMod
R

SCTotal
2

Ing. William len Velsquez

( y y )
y y

2
2

Coeficiente de determinacin (R2)

SCMod
R

SCTotal
2

( y y )
y y

2
2

Donde R2 es la proporcin de la variabilidad de la variable

respuesta y que es explicada por las variables


explicatorias en la regresin lineal mltiple.
A menudo se multiplica R2 por 100 y se expresa como
porcentaje. La raz cuadrada de R2 es el coeficiente de
correlacin mltiple, es la correlacin entre las
observaciones yi y los valores predichos y i .
Ing. William len Velsquez

Coeficiente de determinacin (R2) ajustado


Cuando se evala un modelo de regresin lineal

mltiple nos interesa decidir si una variable dada


mejora la capacidad para predecir la respuesta
comparando el R2 de un modelo que contiene la
variable, con el R2 del modelo sin la variable.
El modelo con mejor R2 debera ser el mejor modelo.
Pero se debe ser cuidadoso cuando se compara los
coeficientes de determinacin de dos modelos
diferentes.
La inclusin de una variable adicional en el modelo
nunca provoca la reduccin de R2.
Ing. William len Velsquez

Coeficiente de determinacin (R2) ajustado


Para manejar este problema, se puede utilizar el R2

ajustado, que ajusta por el nmero de variables que hay


en el modelo.
El R2 ajustado es:

n 1
2
R 1
1 R
n ( p 1)
2
a

Ing. William len Velsquez

Un ejemplo
En educacin existe polmica acerca de las notas de los

colegios que se creen estn infladas. Si no estuvieran


infladas esperaramos que las pruebas de ingreso a la
Universidad estn altamente correlacionadas con las
notas de enseanza media.
Revisemos, con datos de la Prueba de Aptitud Acadmica
(PAA) del ao 2001 en una determinada regin, si
podemos explicar las notas de enseanza media con la
PAA.

Ing. William len Velsquez

Un ejemplo
Resumen del modelo
Modelo
1

R
.578a

R cuadrado
.334

R cuadrado
corregida
.334

Error tp. de la
estimacin
81.25283

a. Variables predictoras: (Constante), Prueba Historia y


Geograf a, Prueba Aptitud Matemtica, Prueba Aptitud Verbal

ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
16400316
32660205
49060521

gl
3
4947
4950

Media
cuadrtica
5466772.0
6602.023

F
828.045

Sig.
.000a

a. Variables predictoras: (Constante), Prueba Historia y Geograf a, Prueba Aptitud


Matemtica, Prueba Aptitud Verbal
b. Variable dependient e: NEM Not as Ens Media
Ing. William len Velsquez

Un ejemplo

Coefici entesa
Coef icientes no
estandarizados
Modelo
1

(Constante)
Prueba Aptitud Verbal
Prueba Aptitud
Matemtica
Prueba Historia y
Geograf a

B
312.088
.153

Error tp.
5.656
.019

.275
.096

a. Variable dependiente: NEM Notas Ens Media

Ing. William len Velsquez

Coef icientes
estandarizad
os
Beta

Interv alo de conf ianza para


B al 95%
Lmite
Lmite inf erior
superior
301.000
323.176
.115
.190

.176

t
55.179
7.993

Sig.
.000
.000

.015

.349

18.133

.000

.245

.304

.019

.098

5.049

.000

.059

.133

Introduccin
Ejemplo
Seis ejecuciones fueron hechas a

varias condiciones de saturacin X1


y transisomers (X2) . La respuesta,
SCI, es listada abajo como Y para
los correspondientes niveles de X1 y
X2.

Ing. William len Velsquez

Introduccin
El grfico para los datos del ejemplo es dado en la figura

1. Slo los modelos de regresin mltiple con dos


variables independientes pueden ser graficados.

Ing. William len Velsquez

Estimacin de mnimos cuadrados


El mtodo de mnimos cuadrados es utilizado para

estimar los parmetros en el modelo de regresin lineal


mltiple

Ing. William len Velsquez

Estimacin de mnimos cuadrados


Suponga que se tienen n >k observaciones. Se asume que

E() =0 y V() =2 y que los errores son no correlacionados.


El mtodo de mnimos cuadrados minimiza la suma de
cuadrados

con respecto a cada uno de los parmetros del modelo 0 1

..k .

Ing. William len Velsquez

Estimacin de mnimos cuadrados


Luego las ecuaciones normales son:

Ing. William len Velsquez

Estimacin de mnimos cuadrados


En esta notacin el modelo se expresa como

con

Ing. William len Velsquez

Estimacin de mnimos cuadrados


donde
Y es el vector de observaciones

X es una matriz de n x p niveles de la variable regresora


es un vector p x 1 de coeficientes de regresin
es el vector aleatorio error de orden p x 1 .

Es importante recordar que p=k+1 ecuaciones. Para

obtener la solucin es conveniente utilizar notacin


matricial.

Ing. William len Velsquez

Estimacin de mnimos cuadrados


La suma de cuadrados del error es dada por

y de manera anloga a la presentada en la notacin

matricial para regresin simple se obtiene que las


ecuaciones normales son

Ing. William len Velsquez

Estimacin de mnimos cuadrados


la cual es similar a las obtenidas anteriormente

Para solucionar las ecuaciones normales se requiere que

exista la inversa de la matriz . Esta existe siempre que las


variables regresoras sean linealmente independientes. As, la
solucin de mnimos cuadrados de vector parmetrico es

Ing. William len Velsquez

Estimacin de mnimos cuadrados. Ejemplo


para los datos del ejemplo tratado el vector Y y la matriz X son

respectivamente

Ing. William len Velsquez

Estimacin de mnimos cuadrados. Ejemplo


La matriz XX es

Ing. William len Velsquez

Estimacin de mnimos cuadrados. Ejemplo


Y el vector XY es

Ing. William len Velsquez

Estimacin de mnimos cuadrados. Ejemplo


El estimador de mnimos cuadrados de es
o

Ing. William len Velsquez

Estimacin de mnimos cuadrados. Ejemplo


Luego el modelo ajustado por mnimos cuadrados es

Ing. William len Velsquez

Anlisis de Varianza
Una tabla bsica de anlisis de varianza es dada por

Ing. William len Velsquez

Ejemplo 1
El

director de recursos humanos de


Ventas S.A. est entrevistando y
seleccionando nuevos vendedores.
El ha diseado una prueba que le
ayudar a realizar la mejor seleccin
posible para la fuerza de ventas.
Con el fin de probar la validez de la
prueba para predecir las ventas
semanales,
l
eligi
vendedores
experimentados y aplic la prueba a cada
uno. La calificacin de cada vendedor fue
entonces pareada con sus ventas
semanales.
Ing. William len Velsquez

Ejemplo 1

Tabla de datos

Calificaciones y ventas semanales de 5 vendedores de


Ventas S.A.
Ventas
Calificacin
Vendedor
Calificacin
semanales
archivada
Luis
4
5,000
2
Rufino
7
12,000
5
Frida
3
4,000
1

Diego
Jos
Ing. William len Velsquez

6
10

8,000
11,000

4
6

Ejemplo 1

Anlisis de regresin mltiple

La ecuacin de regresin simple que tiene una sola variable

independiente tiene la forma general de y' = a + bx.


En el caso de la regresin mltiple la ecuacin tiene varias
variables independientes:

y' = a + b1x1 + b2x2 + ... + bkxk


donde:
X1, X2, ... Xk son las variables independientes.

a es el punto donde la lnea de regresin cruza el eje de las Y.


b1, b2, ... bk son los coeficientes de regresin.
Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

Para encontrar las valores de los

coeficientes de la ecuacin de
regresin ( a, b1, b2, ... bk ) se utiliza
el mtodo de mnimos cuadrados
que consiste en resolver el siguiente
sistema de ecuaciones simultaneas.

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

= an

+ b1x1

+ b2x2

+ ... + bkxk

x1y

= ax1

+ b1x1x1

+ b2x1x2

+ ... + bkx1xk

x2x

= ax2

+ b1x2x1

+ b2x2x2

+ ... + bkx2xk

...
xky

= axk

Ing. William len Velsquez

...
+ b1xkx1

...

...

+ b2xk x2 + ... + bkxkxk

Ejemplo 1

Estimacin de los coeficientes de regresin

Las ventas semanales se representan con y,


La calificacin de la prueba con x1, y
Las calificaciones archivadas con x2.
Con estos datos completamos la siguiente

tabla:

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

Calificaciones y ventas semanales de 5 vendedores de


Ventas S.A.
Vendedor

Luis
Rufino
Frida
Diego
Jos

X1

X2

X12

X22

X1Y

X2Y X1X2

5
12
4
8
11
40

4
7
3
6
10
30

2
5
1
4
6
18

16
49
9
36
100
210

4
25
1
16
36
82

20
84
12
48
110
274

10
60
4
32
66
172

Ing. William len Velsquez

8
35
3
24
60
130

Ejemplo 1

Estimacin de los coeficientes de regresin

Despus de sustituir estas sumatorias en las

frmulas de las ecuaciones, el sistema de


ecuaciones de la siguiente forma:

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

Una vez que ya tenemos el sistema de

ecuaciones, se procede a resolverlo con el


mtodo de nuestra preferencia. En este caso
vamos a utilizar el mtodo de Gauss-Jordan

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

El mtodo de Gauss-Jordan consiste en

convertir la matriz de coeficientes en una


matriz identidad, donde todos los elementos
son nulos salvo los de la diagonal principal
que son 1.

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

En

la
columna
de
los
trminos
independientes quedarn los valores de los
coeficientes de la ecuacin de regresin.

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

1. Expresamos el sistema de ecuaciones como una

matriz aumentada:

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

2. Para convertir el elemento (1,1) en 1, se divide el primer


rengln entre 5.
Para convertir el elemento (2,1) en cero, se multiplica el
rengln 1 por (-30) y se suma al rengln 2.
Para convertir el elemento (3,1) en cero, se multiplica el
rengln 1 por (-18) y se suma al rengln 3.

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

3. Para convertir el elemento (2,2) en 1, se divide el


segundo rengln entre 30.
Para convertir el elemento (1,2) en cero, se multiplica el
rengln 2 por (-6) y se suma al rengln 1.
Para convertir el elemento (3,2) en cero, se multiplica el
rengln 2 por (-22) y se suma al rengln 3.

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

4. Para convertir el elemento (3,3) en 1, se divide el tercer


rengln entre 32/30.
Para convertir el elemento (1,3) en cero, se multiplica el
rengln 3 por (4/5) y se suma al rengln 1.
Para convertir el elemento (2,3) en cero, se multiplica el
rengln 3 por (-22/30) y se suma al rengln 2.

Ing. William len Velsquez

Ejemplo 1

Estimacin de los coeficientes de regresin

Los valores que estn en la columna de la derecha

corresponden a los valores de los coeficientes de la


ecuacin de regresin, de tal forma que:
a = 560/160 = 3.5
b1 = -936/960 = -.975
b2 = 92/32 = 2.875

La ecuacin de regresin queda:


y' = 3.5 - .975x1 + 2.875x2
Ing. William len Velsquez

Ejemplo 1

Anlisis de correlacin mltiple

Los mismos tres coeficientes utilizados en el anlisis

de correlacin simple para describir la relacin entre


la variable dependiente una variable independiente
son usados en el anlisis de correlacin mltiple.

Estos coeficientes son


el coeficiente de correlacin mltiple,
el coeficiente de determinacin mltiple, y
el coeficiente de no determinacin mltiple

Ing. William len Velsquez

Ejemplo 1

Coeficiente de correlacin mltiple.

El coeficiente de correlacin mltiple es una medida

de la fuerza de la asociacin entre la variable


dependiente y dos o mas variables independientes.
El coeficiente de correlacin mltiple solo puede
tener valores entre 0 y + 1.00 inclusive y se
representa con la letra R.
Un coeficiente cercano a + 1.00 indica una muy
fuerte correlacin entre la variable dependiente y las
variables independientes.
Un coeficiente cercano a 0 revela una dbil
correlacin.
Ing. William len Velsquez

Ejemplo 1

Coeficiente de correlacin mltiple.

El coeficiente de correlacin mltiple se calcula de la

siguiente manera:

Ing. William len Velsquez

Ejemplo 1

Coeficiente de determinacin mltiple.

Es la proporcin de la variacin total en la variable dependiente

( Y ) que es explicada por la serie de variables independientes.


El coeficiente de determinacin mltiple es una medida mas

significativa y precisa para medir la asociacin la variable


dependiente y la s variables independientes.
Se simboliza con R. Lgicamente, el coeficiente de no

determinacin mltiple mide la proporcin de la variacin en la


variable dependiente que no es explicada por las variables
independientes.

Ing. William len Velsquez

Ejemplo 1
Coeficiente de determinacin mltiple.
En el ejemplo de los cinco vendedores de Ventas S.A. para

calcular el coeficiente de correlacin mltiple utilizamos la


siguiente tabla: y' = 3.5 - .975X1 + 2.875X2
Vendedor
Jos Luis
Rufino
Frida
Diego
Jos
Clemente

Ing. William len Velsquez

y
5
12
4
8

x1
4
7
3
6

x2
2
5
1
4

11

10

y'
y - y' ( y - y )2 y - ( y - )2
5.35 -.35
.1225 - 3
9
11.05 .95
.9025
4
16
3.45
.55
.3025 - 4
16
9.15 -1.15 1.3225 0
0

11

0
2.65

9
50

Ejemplo 1

Coeficiente de determinacin mltiple.

Se calculan los coeficientes de correlacin y

determinacin mltiple.

Ing. William len Velsquez

Ejemplo 1

INTERPRETACIN

Podemos concluir que hay una fuerte correlacin

entre las ventas y las dos variables independientes,


las calificaciones de la prueba y las calificaciones
archivadas.
Un 94.7% de la variacin de las ventas semanales se

explican por la variacin de las calificaciones de la


prueba y la variacin de las calificaciones
archivadas.
Ing. William len Velsquez

Ejemplo 2:
El propietario de la cadena de cines
CINE PLANET desea estimar el
ingreso semanal neto en funcin de
los gastos de publicidad.
Los datos histricos de una muestra
de 8 semanas son los siguientes:

Ing. William len Velsquez

Ejemplo 2:
Ingresos Brutos
semanales
(en
miles de dlares)

Anuncios en TV
(en miles de dlares)

Anuncios en
peridicos
(en miles de dlares)

96
90
95
92
95
94
94
94

5.0
2.0
4.0
2.5
3.0
3.5
2.5
3.0

1.5
2.0
1.5
2.5
3.3
2.3
4.2
2.5

Ing. William len Velsquez

Ejemplo 2:
96
90

95

92

y
95

94
94

948 x1
Ing. William len Velsquez

Planteando matricialmente los datos

1
1
1
1
1
1
1
1

5.0
2.0
4.0
2.5
3.0
3.5
2.5
3.0

1.5
2.0
1.5
2.5
3.3
2.3
4.2
2.5

b
b

8x3

3 x1

Ejemplo 2:

Determinando la ecuacin de regresin


El modelo es:
y b b x b x
0

Entonces primero resolvemos las matrices

para encontrar los parmetros:


1

( X X ) X y

5,9989

-1,0389

-1,0353

-1,0389

0,2239

0,1313

-1,0353

0,1313

0,2491

Ing. William len Velsquez

( X X )

750 83.2301 b0
2401 2.2902 b
1


1856 1.3010 b2

X y

Ejemplo 2:

Finalmente la ecuacin es:

y 83.2301 2.2902 X 1 1.3010 X 2


Coefi cientesa
Coef icientes no
est andarizados
Modelo
1

(Constante)
Anunc ios en TV (en
miles de dlares)
Anunc ios en peridicos
(en miles de dlares)

B
83. 230

Error t p.
1. 574

2. 290

.304

1. 301

.321

a. Variable dependiente: Ingres os Brutos semanales

Ing. William len Velsquez

Coef icientes
est andarizad
os
Beta

Interv alo de conf ianza para


B al 95%
L mite
L mite inf erior
superior
79. 184
87. 276

t
52. 882

Sig.
.000

1. 153

7. 532

.001

1. 509

3. 072

.621

4. 057

.010

.477

2. 125

(en miles de dlares)

Ejemplo 2:

Finalmente la ecuacin es:

Interpretemos los parmetros estimados de las variables


independientes:
Para b1: Cuando los gastos de anunciar en televisin
varan una unidad y los gastos de anunciar en
peridicos se mantienen constantes, los ingresos
brutos semanales se incrementarn en 2.2902 miles de
dlares.
Para b2: Cuando los gastos de anunciar en televisin se
mantienen constantes y los gastos de anunciar en
peridicos varan una unidad, los ingresos brutos
semanales se incrementarn en 1.3010 miles de
dlares.
Ing. William len Velsquez

Ejemplo 2:

Hallando el error estndar de estimacin


Para lo cual usaremos la frmula abreviada para dos

variables independientes la cual se deriva de la forma general


presentada en las frmulas a utilizar. La frmula es la
siguiente:

y b y b X y b X y

S y. X X
1

Ing. William len Velsquez

n3

Ejemplo 2:

Hallando el error estndar de estimacin


Reemplazando los valores previamente encontrados y
tomando el denominador al valor 3 por ser el nmero de
parmetros q intervienen en la ecuacin:
Resumen del modelo
Modelo
1

R
.959a

R c uadrado
.919

R c uadrado
corregida
.887

Error t p. de la
est imac in
.64259

a. Variables predict oras: (Cons tant e), Anuncios en peridicos


(en miles de dlares), Anuncios en TV (en miles de dlares)

S y. X1 X 2 0.64

Interpretacin: La distancia promedio de los valores


observados alrededor de la ecuacin de regresin es de
0.64. Es decir la dispersin de los valores observados es
0.64.
Ing. William len Velsquez

Ejemplo 2:

Hallando el Coeficiente de Determinacin

Elevamos al cuadrado el coeficiente de correlacin y


encontraremos el coeficiente de determinacin:

r 0.959
r 2 0.919

Resumen del modelo


Modelo
1

R
.959a

R c uadrado
.919

R c uadrado
corregida
.887

Error t p. de la
est imac in
.64259

a. Variables predict oras: (Cons tant e), Anuncios en peridicos


(en miles de dlares), Anuncios en TV (en miles de dlares)

Interpretacin:

r 0.959
r 0.919
2

Aproximadamente el 91.9% de los cambios


producidos en los ingresos brutos semanales son explicados por
los cambios producidos en los gastos de publicidad (en
televisin y peridicos)

Ing. William len Velsquez

Ejemplo 2:

COEFICIENTE DE DETERMINACION
CORREGIDO

SCE
R2Y.12...p= ----------SCTO
n-1
R2Corr.= 1- ((1- R2Y.12.. k ) ---------n-k-1

Necesario cuando se
comparan 2 o + modelos
de regresin que
predicen Y, pero con
diferente N de Xi
Ing. William len Velsquez

Coeficiente de
Determinacin
Mltiple

Representa la porcin de
la variacin en Y que se
puede explicar por Xi

Ejemplo 2:

MATRIZ DE CORRELACION
Correlaci ones

Correlac in de Pears on

Sig. (unilat eral)

Ing. William len Velsquez

Ingres os Brutos
sem anales
(en
m iles de dlares)
Anunc ios en TV (en
m iles de dlares)
Anunc ios en peridicos
(en m iles de dlares)
Ingres os Brutos
sem anales
(en
m iles de dlares)
Anunc ios en TV (en
m iles de dlares)
Anunc ios en peridicos
(en m iles de dlares)
Ingres os Brutos
sem anales
(en
m iles de dlares)
Anunc ios en TV (en
m iles de dlares)
Anunc ios en peridicos
(en m iles de dlares)

Ingres os
Brut os
sem anales
(en m iles de
dlares)

Anunc ios en
TV (en m iles
de dlares)

Anunc ios en
peridicos
(en m iles de
dlares)

1. 000

.808

-. 021

.808

1. 000

-. 556

-. 021

-. 556

1. 000

.008

.481

.008

.076

.481

.076

Anova

Ejemplo 2:

H 0 : 1 2 3 ... k 0

H1 : Por lo menos un i 0
ANOVAb
Modelo
1

Regresin
Res idual
Tot al

Suma de
cuadrados
23. 435
2. 065
25. 500

gl
2
5
7

Media
cuadrt ica
11. 718
.413

F
28. 378

Sig.
.002a

a. Variables predict oras : (Const ante), Anuncios en peridicos (en miles de dlares),
Anunc ios en TV (en miles de dlares)
b. Variable dependiente: Ingresos Brut os s emanales

(en miles de dlares)

En este caso p = 0.002 < 0.05, por lo que se rechaza Ho, lo


que ratifica la relacin entre las variables.
Ing. William len Velsquez

Ejemplo 3
La Facultad de una Universidad
quiere entender los factores de
aprendizaje de los alumnos que
cursan la asignatura de Gestin de
Proyectos, para lo cual se escoge al
azar una muestra de 7 alumnos y
ellos registran notas promedios en
las asignaturas de Contabilidad
Bsica,
Doctrina
Contable
y
Macroeconoma como se muestran
en el siguiente cuadro.
Ing. William len Velsquez

Ejemplo 3
Alumno

Gestin de
Proyectos

Contabilidad
Bsica

Doctrina
Contable

Macroeconoma

1
2
3
4
5
6
7

13
13
13
15
16
15
12

15
14
16
20
18
16
13

15
13
13
14
18
17
15

13
12
14
16
17
15
11

Determinar la dependencia que exista de aprendizaje reflejada en


las notas de la asignatura de Mtodos Cuantitativos, conociendo
las notas de las asignaturas Contabilidad Bsica, Doctrina Contable
II y Macroeconoma, con un
nivel
significancia del 5%
Ing. William
len de
Velsquez

Ejemplo 3
Calculamos los coeficientes de regresin utilizando las
frmulas de las ecuaciones o mediante un programa
Coeficientesa

Modelo
1

(Constante)
Contabilidad Basica
Doctrina Cont able
Macroeconomia

Coef icientes no
estandarizados
B
Error tp.
3.140
2.529
.054
.309
.189
.189
.501
.390

a. Variable dependient e: Metodos Cuantitativ os

Ing. William len Velsquez

Coef icientes
estandarizad
os
Beta
.088
.248
.739

t
1.241
.175
.999
1.284

Sig.
.303
.872
.391
.289

Ejemplo 3
Por lo tanto podemos construir la ecuacin de
regresin que buscamos:
= 3.140 + 0.054 X1 + 0.189 X2 + 0.501 X3
En el anlisis de regresin mltiple la constante es el
valor de la ecuacin de regresin de la variable
dependiente Y dado que todas las variables
independientes sean iguales a cero.

Ing. William len Velsquez

Ejemplo 3
En los resultados del programas se llama error tpico
y para explicar la relacin del aprendizaje de
Mtodos Cuantitativos que se viene desarrollando es
de 0.529
Resumen del modelo
Modelo
1

R
.967a

R cuadrado
.935

R cuadrado
corregida
.869

Error tp. de la
estimacin
.529

a. Variables predictoras: (Constante), Macroeconomia,


Doctrina Contable, Contabilidad Basica
Ing. William len Velsquez

Ejemplo 3
Calculando el coeficiente de Determinacin en
el ejercicio (con variable independiente).

12.018
12.857

0.934 = R2..Interprete

R = ; Interprete
Ing. William len Velsquez

Ejemplo 3
Trabajando con el ejemplo del curso de Gestin de
Proyectos, veremos que aplicando SPSS, nos saldra
como resultado:
ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
12.018
.840
12.857

gl
3
3
6

Media
cuadrtica
4.006
.280

F
14.314

a. Variables predictoras: (Constante), Macroeconomia, Doctrina Contable,


Contabilidad Basica
b. Variable dependient e: Metodos Cuantitativ os

A que conclusin podemos llegar al 3% de error?


Ing. William len Velsquez

Sig.
.028a

FIN
Consultas o sugerencias
wjleonv@yahoo.com
Ing. William len Velsquez

85