Está en la página 1de 48

Regresin lineal mltiple

Estadstica matemtica II
Mtodos estadsticos I
MDULO 2 REGRESIN LINEAL MLTIPLE
Datos y modelo
Nmero de
observacin
Variable
respuesta
Variables predictoras
y
!

"
#
p
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
! y
!

!!

!"
#
!p
" y
"

"!

""
#
"p
$ y
$

$!

$"
#
$p
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
n y
n

n!

n"

np
+ + + + + =
p p
x x x y L
2 2 1 1 0
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
i ip p i i i
x x x y + + + + + = L
2 2 1 1 0
El modelo de regresin lineal mltiple es una etensin &generali'acin( del modelo
de regresin lineal simple% Es decir) los resultados presentados en adelante son
etensiones de los resultados presentados en el mdulo anterior%
*e podra pensar tambin +ue el modelo de regresin lineal simple es un caso
especial del modelo de regresin lineal mltiple dado +ue todos los resultados del
modelo de regresin lineal simple se pueden obtener usando los resultados del
modelo de regresin lineal mltiple cuando el nmero de variables predictoras es p,!%
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
E-emplo
*e .a medido el contenido medio en al+uitrn &en miligramos() nicotina &en
miligramos( y monido de carbono producido en la combustin &en miligramos( de
cigarrillos de una serie de marcas de tabaco% /os datos se proporcionan en la siguiente
tabla% *e pretende estudiar la relacin entre el monido de carbono producido en la
combustin de un cigarrillo y su contenido en al+uitrn y nicotina%
Marca Alquitran Nicotina CO
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
Marca Alquitran Nicotina CO
1 Alpine 14.1 0.86 13.6
2 Benson-Edges 16.0 1.06 16.6
3 Bull-Durham 29.8 2.03 23.5
4 Camel-lights 8.0 0.67 10.2
5 Carlton 4.1 0.40 5.4
6 Chesteroeld 15.0 1.04 15.0
a% Estudie la relacin entre el monido de carbono y el al+uitrn%
b% Estudie la relacin entre el monido de carbono y la nicotina%
c% Realice la regresin mltiple del monido de carbono 0rente a la nicotina y el
al+uitrn simultneamente% +u di0erencias llamativas se aprecia entre este
estudio y los dos estudios previos1 23 +u pueden deberse1
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
Estimacin de parmetros
. , , 2 , 1 ,
1 1 0
n i x x y
ip p i i i
K L = =
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
. ) ( ) , , , (
1 1
2
1 1 0
2
1 0
= =
= =
n
i
n
i
ip p i i i p
x x y S K K
4sando los coe0icientes de regresin estimados se puede escribir las ecuaciones de
regresin de mnimos cuadrados a-ustados como
&5(
6ara cada observacin en los datos se puede calcular
&7(
.

2 2 1 1 0 p p
x x x y + + + + = L
.

2 2 1 1 0 ip p i i i
x x x y + + + + = L
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
Estos son llamados de valores a-ustados% /os correspondientes residuales de mnimos
cuadrados ordinarios estn dados por
&8(
. , , 2 , 1 , n i y y e
i i i
K = =
4na estimacin de la varian'a residual esta dada por
&9(
donde
&:(
es la suma de cuadrados de los residuales% El nmero de n;p;! en el denominador de
1

2

=
p n
SSE

, ) (
1
2
1
2

= =
= =
n
i
i
n
i
i i
e y y SSE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
es la suma de cuadrados de los residuales% El nmero de n;p;! en el denominador de
&:( se llama los grados de libertad &d%0 o g%l(% Es decir) es igual al nmero de
observaciones menos el nmero de coe0icientes de regresin estimados%
Interpretacin de coe0icientes de
regresin
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
E-emplo
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
6ropiedades de los estimadores de
mnimos cuadrados
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
<oe0iciente de correlacin mltiple
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
In0erencia para coe0icientes de
regresin individuales
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
E-emplo
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
6redicciones
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
Diagnsticos del modelo de regresin
lineal mltiple
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
El e0ecto de los errores de medicin podra incrementar la varian'a residual y
reducir la magnitud del coe0iciente de correlacin mltiple observado%
/a estimacin del coe0iciente de regresin para una variable es a0ectada por
su propio error de medicin y por los errores de medicin de otras variables
incluidas en la ecuacin%
/a ecuacin de regresin se puede usar para reali'ar predicciones) sin
embargo) la presencia de errores disminuye la precisin de las predicciones%
$% /as variables predictoras
!
)
"
) #)
p
se asumen independientemente lineales
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
$% /as variables predictoras
!
)
"
) #)
p
se asumen independientemente lineales
unas de otras% Este supuesto es necesario para garanti'ar la unicidad de la solucin
de mnimos cuadrados% *i se viola este supuesto el problema se conoce como
problema de colinealidad%
/os dos primeros supuestos no se pueden validar ) aun+ue -uegan un papel muy
importante en el anlisis% *in embargo) no in0luencian la interpretacin de los
resultados de regresin%
*upuestos sobre las observaciones= >odas las observaciones son igualmente 0iables y
tienen aproimadamente el mismo papel en la determinacin de los resultados de la
regresin y en la in0luencia de las conclusiones%
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
>ipos de residuales
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
/os gr0icos de residuales pueden apuntar violaciones serias de uno o ms de los
supuestos estndar%
El anlisis de los residuales puede llevar a sugerir estructuras o in0ormacin de
puntos +ue pueden estar 0altantes o +ue se pueden pasar por alto si el anlisis esta
basado solamente en las medidas de resumen%
Estas sugerencias pueden llevar a un me-or entendimiento y posiblemente un
me-or modelo del proceso ba-o estudio%
4n anlisis gr0ico cuidadoso de los residuales puede ser la parte ms importante
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
4n anlisis gr0ico cuidadoso de los residuales puede ser la parte ms importante
de un anlisis de regresin%
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
Mtodos gr0icos
/os mtodos gr0icos se pueden usar para=
!% Detectar errores en los datos%
"% Reconocer patrones en los datos &clusters) outliers) espacios) etc(
$% Eplorar relaciones entre variables%
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
?% Descubrir nuevos 0enmenos%
5% <on0irmar o negar supuestos%
7% Evaluar la adecuacin de un modelo a-ustado%
8% *ugerir acciones remediales &trans0ormar los datos) redise@ar el eperimento)
recolectar ms datos) etc(%
9% Me-orar el anlisis numrico en general%
/os gr0icos se pueden clasi0icar en dos=
Ar0icos antes del a-uste del modelo= *on tiles) por e-emplo) para corregir errores en
los datos y para seleccionar un modelo%
Ar0icos despus del a-uste del modelo= *on tiles para c.e+uear los supuestos y para
evaluar la bondad del a-uste%
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
*on tiles) por e-emplo) para corregir errores en los datos y para seleccionar un
modelo%
/a 0orma del modelo +ue representa la relacin entre la variable respuestas y las
predictoras se debe basar en el conocimiento terico o las .iptesis +ue se +uieren
probar% *in embargo) si no .ay conocimiento a priori sobre la 0orma del modelo) se
pueden usar los datos para sugerir el modelo% <uatro posibles gr0icos son=
Ar0icos antes del a-uste del modelo
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
Ar0icos unidimensionales= Bistogramas) boplot%
Ar0icos bidimensionales= Matri' de gr0icos de dispersin%
Ar0icos tridimensionales= Ar0icos en tres dimensiones &super0icies de respuesta(%
*on tiles para c.e+uear los supuestos y para evaluar la bondad del a-uste%
Ar0icos para c.e+uear los supuestos de linealidad y normalidad%
Ar0icos para detectar outliers y observaciones in0luyentes%
Ar0icos despus del a-uste del modelo
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
Ar0icos de diagnostico para el e0ecto de las variables%
/inealidad) normalidad e
independencia
!% Ar0ico de probabilidad normal de los residuales estandari'ados%
"% Ar0icos de dispersin de las variables predictoras versus los residuales
estandari'ados%
$% Ar0ico de dispersin de los valores a-ustados versus los residuales
estandari'ados%
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
estandari'ados%
?% Ar0ico de orden de las observaciones versus los residuales estandari'ados%
/everage) in0luencia y outliers
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
b( Cutlier c( alto leverage d( in0luencia &alto leverage y outlier(
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
/as 0iguras !( a d( ilustran las di0erencias entre los puntos outlier) de in0luencia y alto
leverage%
En la 0igura a( se observan los puntos alineados sin ningn tipo de perturbacin%
En la 0igura b( se perturba el punto 5 .acindolo outlier% Note +ue la eclusin del
mismo &recta punteada( altera slo el intercepto) es decir) los valores a-ustados% Es un
punto +ue no esta muy ale-ado de los dems) luego tiene un .
ii
relativamente
pe+ue@o%
En la 0igura c( se perturba el punto 5 de modo +ue el mismo +uede ms ale-ado del
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
En la 0igura c( se perturba el punto 5 de modo +ue el mismo +uede ms ale-ado del
subespacio generado por las columnas de la matri' D% Es un punto de alto leverage)
aun+ue su eliminacin no muda prcticamente nada en las estimativas de los
parmetros% <omo es un punto con un .
ii
relativamente alto) las varian'as de los
valores a-ustados de los puntos primos al mismo sern mayores +ue las varian'as
de los valores a-ustados correspondientes a los dems puntos%
En la 0igura d( se perturba de nuevo el punto 5 .acindolo a.ora un punto de
in0luencia e de alto leverage% El mismo) adems de cambiar las estimativas de la
pendiente de la recta a-ustada) continua ms ale-ado de los dems puntos%
Medidas de in0luencia
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
E-emplo= Datos de tasa de mortalidad
datos E; read%table&0ile%c.oose&().eader,>(
.ead&datos(
attac.&datos(
plot&,al0abeti'acion) y,tasamortin0) pc.,!:) lab,F3l0abeti'acin &G(F) ylab,F>asa de
mortalidad in0atil &por mil ni@os(F(
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
identi0y&al0abeti'acion) tasamortin0) 6ais) 5(
mod! E; lm&tasamortin0Hal0abeti'acionI6IJIpoblacion(
mod" E; lm&tasamortin0Hal0abeti'acionI log&6IJ( I log&poblacion((
summary&mod"(
in0luence%measures&mod"(
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
E-emplo= Ve.culos
*e .a recopilado un con-unto de datos relacionados con !55 modelos de ve.culos
salidos al mercado americano entre los a@os !:89 y !:9"% /a base de datos Vehculos
muestran el consumo &en millas por galn() el peso &en Kilogramos() la potencia &en
caballos de vapor() la aceleracin) el precio &en dlares() el a@o de salida al mercado y
el origen &valor ! para modelos americanos) " para europeos y $ para -aponeses( de
Variables regresoras cualitativas
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
el origen &valor ! para modelos americanos) " para europeos y $ para -aponeses( de
estos modelos%
a% <onstruya un modelo de regresin para eplicar el consumo de ve.culos en
0uncin de el peso y la potencia% Indi+ue +u modelo obtiene%
b% Veri0i+ue si se cumplen las .iptesis del modelo de regresin mltiple) detecta
alguna anomala1% En caso de detectar alguna anomala indi+ue +ue accin
correctora adoptara%
c% 3 continuacin estudie la relacin entre el precio) como variable dependiente) y la
potencia y el peso como variables eplicativas%
d% <ules de los parmetros del modelo son signi0icativos con un nivel de signi0icancia
del 5G1
e% /os a@os en +ue esos modelos salieron al mercado 0ueron de 0uertes crecimientos
de los precios% Introdu'ca el a@o de salida al mercado del modelo como variable
regresora e indi+ue si es signi0icativa%
0% El origen de los ve.culos podra ser in0luyente en el precio% Introdu'ca ese 0actor
mediante dos variables cualitativas% 6roporcione el modelo 0inal seleccionado%
g% <onstruya dos modelos de regresin simple con la aceleracin como dependiente y
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
g% <onstruya dos modelos de regresin simple con la aceleracin como dependiente y
con el peso y la potencia como independientes y despus una regresin mltiple
con aceleracin como dependiente y peso y potencia como independientes%
Cbserve los signos de los coe0icientes e interprete lo +ue ocurre%
E-emplo= *alarios
El con-unto de datos *alarios 0ue desarrollada a partir de un estudio de los salarios de
los pro0esionales en ingeniera de sistemas de una empresa% El ob-etivo de la encuesta
0ue identi0icar las variables +ue determinan las di0erencias salariales%
/a variable respuesta es el salario) y las variables regresoras son= eperiencia &a@os)()
educacin) & de ! a $) siendo ! menor grado de escolaridad y $ mayor grado de
escolaridad( y direccin &! y L) siendo ! una persona con alta capacidad de direccin y
L con menor capacidad de direccin(%
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
L con menor capacidad de direccin(%
3-ustar un modelo de regresin +ue epli+ue la relacin entre el salario y las variables
regresoras eperiencia) educacin y direccin% 4sar variable indicadoras para
educacin%
Variables de interaccin
El con-unto de datos *alarios 0ue desarrollada a partir de un estudio de los salarios de
los pro0esionales en ingeniera de sistemas de una empresa% El ob-etivo de la encuesta
0ue identi0icar las variables +ue determinan las di0erencias salariales%
/a variable respuesta es el salario) y las variables regresoras son= eperiencia &a@os)()
E-emplo= *alarios
MTODOS ESTADSTICOS MDULO 1 REGRESIN LINEAL SIMPLE
MDULO 2 REGRESIN LINEAL MLTIPLE
/a variable respuesta es el salario) y las variables regresoras son= eperiencia &a@os)()
educacin) & de ! a $) siendo ! menor grado de escolaridad y $ mayor grado de
escolaridad( y direccin &! y L) siendo ! una persona con alta capacidad de direccin y
L con menor capacidad de direccin(%
3-ustar un modelo de regresin +ue epli+ue la relacin entre el salario y las variables
regresoras eperiencia) educacin y direccin% 4sar variable indicadoras para
educacin y las interacciones entre las indicadoras y la direccin%
Identi0icar puntos de in0luencia y anali'ar el modelo%

También podría gustarte