Regresion Simple y Multiple

nav
Estadstica (complementos)
REGRESION Y CORRELACION
Frmulas bsicas en la regresin lineal simple
Como ejemplo de anlisis de regresin, describiremos el caso de Pizzera
Armand, cadena de restaurantes de comida italiana. Los lugares donde sus
establecimientos han tenido ms xito estn cercanos a establecimientos de
educacin superior. Se cree que las ventas trimestrales (representadas por y) en
esos restaurantes, se relacionan en forma positiva con la poblacin estudiantil
(representada por x). Es decir, que los restaurantes cercanos a centros escolares
con gran poblacin tienden a generar ms ventas que los que estn cerca de
centros con poblacin pequea. Aplicando el anlisis de regresin podremos
plantear una ecuacin que muestre cmo se relaciona la variable dependiente
y con la variable independiente x.
El modelo de regresin y la ecuacin de regresin
En el ejemplo, cada restaurante est asociado con un valor de x (poblacin
estudiantil en miles de estudiantes) y un valor correspondiente de y (ventas
trimestrales en miles de $). La ecuacin que describe cmo se relaciona y con x
y con un trmino de error se llama modelo de regresin. ste usado en la
regresin lineal simple es el siguiente:
Modelo de regresin lineal simple:
y = 0 + 1 x +
0 y 1 son los parmetros del modelo. es una variable aleatoria, llamada error,
que explica la variabilidad en y que no se puede explicar con la relacin lineal
entre x y y.
Los errores, , se consideran variables aleatorias independientes distribuidas
normalmente con media cero y desviacin estndar . Esto implica que el valor
medio o valor esperado de y, denotado por E(Y/x), es igual a 0 + 1 x.
Ecuacin de regresin lineal simple:
1 >0
E(y/x) = 0 + 1 x
( Y/x=E(Y/x) )
1 <0
1 =0
nav
La ecuacin estimada de regresin (lineal simple)

Los parmetros, 0 y 1, del modelo se estiman por los estadsticos muestrales b0 y
b1, los cuales se calculan usando el mtodo de mnimos cuadrados.
Ecuacin Estimada de regresin lineal simple:
= b0 + b1 x
En la regresin lineal simple, la grfica de la ecuacin de regresin se llama

lnea de regresin estimada. es el valor estimado de y para un valor
especfico de x.
Datos de poblacin estudiantil y ventas trimestrales para una muestra de 10
restaurantes:
restaurante
1
2
3
4
5
6
7
8
9
10
Poblac. estudiantil
(en miles)
xi
2
6
8
8
12
16
20
20
22
26
Ventas trimestrales
(miles de $)
yi
58
105
88
118
117
137
157
169
149
202
Diagrama de dispersin
220
200
180
160
140
120
100
80
60
40
0
10
12
poblacin estud. (miles)
14
16
18
20
22
24
26
28
30
nav
Diagrama de dispersin
(y lnea de regresin estimada)
220
200
180
= b 0 + b1 x
160
140
120
100
80
60
40
0
10
12
14
16
18
20
22
24
26
28
30
El mtodo de mnimos cuadrados consiste en hallar los valores b0 y b1 que hacen

mnima la suma de los cuadrados de las desviaciones entre los valores observados de
la variable dependiente, yi, y los valores estimados de la misma, i. Es decir se minimiza
la suma: (yi i)2.
Al aplicar el mtodo se llega al siguiente sistema de ecuaciones simultneas (llamadas
ecuaciones normales de la recta de regresin de y en x), cuya solucin da los valores
de b0 y b1:
nb0 ( xi )b1
yi
2
xi yi ( xi )b0 ( xi )b1
Las soluciones son las siguientes:
b1
x y
x i y i _ in i
( x )2
x _ ni
2
i
( xi x )( yi y )
que tambin es b1
( xi x )2
y b0 y b1x
Determine la ecuacin de regresin con los datos dados.
b1=
b0=
=
( xi x )( yi y )
n 1
( xi x )2
n 1
SXY
SX2
nav
restaurante
1
2
3
4
5
6
7
8
9
10
xi
yi
xiyi
2
6
8
8
12
16
20
20
22
26
140
58
105
88
118
117
137
157
169
149
202
1300
21040
4
x i2
2528
El coeficiente de determinacin (r2)

El coeficiente de determinacin en la regresin lineal simple es una medida de la
bondad de ajuste de la recta estimada a los datos reales.
Suma de cuadrados debida al error:
SCE = (yi i )2
Suma de cuadrados total:
SCT = (yi y )2
Suma de cuadrados debida a la regresin: SCR = (i - y )2

Relacin entre SCT, SCR y SCE:
SCT = SCR + SCE
Coeficiente de determinacin :
r2
SCR SCT SCE

SCE
1
SCT =
SCT
SCT
r2
Expresado en porcentaje, se puede interpretar como el porcentaje de la variabilidad

total de Y que se puede explicar aplicando la ecuacin de regresin.
220
200
180
= b 0 + b1 x
=60 + 5x
160
140
120
100
y 130
80
60
40
0
10
12
14
16
18
20
22
24
26
28
30
nav
clculo de SCE y SCT

restauran
te
xi
Yi
(poblac.
(ventas
estud)
trimest.)
1
2
3
4
5
6
7
8
9
10
2
6
8
8
12
16
20
20
22
26
58
105
88
118
117
137
157
169
149
202
TOTALES
140
1,300
Residuales
yi i
i = 60 + 5 xi
(yi i)2
yi
(yi 130)
SCE=1,530
(yi y )2
=
(yi 130)2
SCT=15,730
La suma de cuadrados debida a la regresin se calcula por diferencia:

SCR = SCT SCE = 15,730 1,530 = 14,200
El coeficiente de determinacin es entonces:
r2
SCR
SCT =
14,200/15,730 = 0.9027
El 90.27% de la variacin en las ventas se puede explicar con la relacin lineal entre la
poblacin estudiantil y las ventas.
El coeficiente de correlacin lineal (r)
Es una medida descriptiva que mide la intensidad de asociacin lineal entre las dos
variables, x y y. Los valores del coeficiente de correlacin lineal siempre estn entre 1 y
+1. 1 significa una relacin lineal negativa perfecta, +1 significa una relacin lineal
positiva perfecta. Los valores cercanos a cero indican que las variables x y y no tiene
relacin lineal. El coeficiente de correlacin lineal se relaciona con el coeficiente de
determinacin as:
r = (signo de b1) r 2
(1)
b1 es la pendiente la recta de regresin de y en x.

El coeficiente de determinacin es ms general que el coeficiente de correlacin
lineal.
PRUEBAS DE SIGNIFICACIN PARA LA REGRESIN LINEAL
La ecuacin de regresin lineal simple indica que el valor medio o valor

esperado de y es una funcin lineal de x: E(y/x) = 0 + 1 x. Si 1=0 entonces
E(y/x) = 0 y en este caso el valor medio no depende del valor de x, y
concluimos que x y y no tienen relacin lineal. En forma alternativa, si el valor
1 0 llegamos a la conclusin que las dos variables se relacionan ( ms
especficamente, que hay una componente lineal en el modelo). Existen dos
pruebas, por lo menos, que se pueden utilizar para tal fin. En ambas se requiere
una estimacin de 2, la varianza de en el modelo de regresin.
(1)
El coeficiente de correlacin se define como
SXY
Sx SY
denominador es el producto de las desviaciones tpicas.
; SXY es la covarianza muestral y el
nav
Cuadrados medios del error CME ( es una estimacin de 2)

S2 = CME = SCE/(n-2)
n-2 son los grados de libertad asociados a SCE. 2 son los parmetros estimados
en la regresin lineal ( 0 y 1 ) y n es el nmero de pares de datos.
Error estndar de estimacin (s)
Es la raz cuadrada de s2, s CME
SCE
n2
y es el estimador de la desviacin
estndar .
Distribucin muestral de b1
b1 es un estadstico con distribucin normal de media
b1=
(x i x)2
b1 = 1 y desviacin estndar
Si sustituimos por su estimacin muestral, s, obtenemos un
estimador de b1 que denotaremos por sb1.

informacin podemos construir un estadstico t. t
sb1=
s
(x i x)2
Con esta
b1 1
el cual se distribuye
sb1
con =n-2 g.l.

Prueba t de significacin en la regresin
H0: 1 = 0
H1: 1 0
Estadstico de contraste bajo H0, tc
b1 0
sb1
Decisin: Se rechaza H0 en favor de H1 si |tc |> t 2 o si p-valor <

( Realizar la prueba con los datos del ejm propuesto).
Prueba de significancia usando el estadstico F (es una prueba ms general)
Se usan dos estimaciones de 2, una basada en CME y la otra basada en CMR.
CME
SCE
n 2
CMR
SCR
SCR
.
nmerode var iables independientes
1
CME es un estimador insesgado de 2, mientras que CMR lo es slo si H0 es

cierta. Si H0 es falsa, CMR tiende a sobreestimar 2.
El estadstico de contraste, bajo H0 es una F. F=CMR/CME con 1 gl en el
numerador y n-2 en el denominador. Los datos se acomodan en una tabla
ANOVA. Se rechaza H0 en favor de H1 si Fc>F o tambin si el p-valor
correspondiente es menor que el nivel de significancia
nav
Tabla ANOVA
Fuente de
variacin
Regresin
Error
total
Suma de
cuadrados
SCR
SCE
SCT
Grados de
libertad
1
n-2
n-1
Cuadrados
medios
CMR
CME
p-valor o
sig.
F=CMR/CME
Realiza la prueba del ejemplo usando ANOVA.

Fuente de
variacin
Suma de
cuadrados
Grados de
libertad
Cuadrados
medios
p-valor o
sig.
Uso de la ecuacin de regresin lineal para evaluar y predecir.

El modelo de regresin lineal simple es un supuesto acerca de la relacin entre x
y y. Si los resultados tienen una relacin estadsticamente significativa entre x y
y, y si el ajuste que proporciona la ecuacin de regresin parece bueno, sta
podra utilizarse para estimaciones y predicciones.
Intervalo de confianza para estimar la media de y para un valor dado xp de x.
Y /X p =E(y/xp): p t /2
( xp x )2
1
s n
( x x )2
i
Intervalo de prediccin para estimar un valor individual de Y para un valor dado

xp de x:
( xp x )2
n ( x x )2
i
Yp: p t/2 s 1 1
220
200
180
160
140
120
100
VENTAS
80
60
40
0
POBLAC
10
12
14
16
18
20
22
24
26
28
30
nav
Ejercicio:
a) Se desea estimar, mediante un intervalo del 95% de confianza, el promedio de
venta trimestral para todos los restaurantes cercanos a centros escolares con
10,000 estudiantes:
Y:
p t/2 s
xp= 10 ; p=60+5(10)=110 ; x =140/10 = 14 ; (x i x)2 = 568 ; n=10 ;
(xp x)2 =(10 14)2 =16 ; s CME
Y/x=10
SCE
n2
1530
8
13.8293 ; t /2= 2.306
: 110 11.415 miles de dlares.
b) Se desea predecir, mediante un intervalo del 95% de confianza, las ventas

trimestrales para un restaurante que se construir cercano a un centro estudiantil
de 10,000 estudiantes :
( xp x )2
1
Yp: p t /2 s 1
n ( xi x )2
Yp: 110 33.875 miles de dlares
Anlisis de residuales: validacin de los supuestos del modelo
Como ya se dijo, el residual en la observacin i es la diferencia entre el valor observado de la
variable dependiente (yi) y el valor estimado de esa variable ( yi ).
Residual en observacin i: yi yi
El anlisis de residuales es la principal herramienta para determinar si es adecuado el modelo
de regresin supuesto. y = 0 + 1x + ; es el trmino del error en el modelo, y se hacen
los siguientes supuestos para l:
1.
2.
3.
4.
E() = 0
La varianza de , representada por 2, es igual para todos los valores de x.
Los valores de son independientes.
El trmino del error, , tiene tendencia normal de probabilidad.
Estos supuestos forman la base terica de las pruebas t y F que se usan para determinar si la
relacin entre x y Y es significativa, y para los estimados de intervalos de confianza y de
prediccin que ya se describieron.
El SPSS provee dos tipos de grficos para determinar las caracterstica de los residuales: Un
grfico de residuales en funcin de x o de y , con el cual se puede analizar si la varianza es
constante, y un grfico de probabilidad normal. Generalmente se trabaja con los residuales
estandarizados o tipificados.
Determinar estos grficos para los datos del ejemplo de la pizera Armand.
Hay otros anlisis para los residuales que permiten determinar valores atpicos y
observaciones influyentes en los datos muestrales que por ahora no estudiaremos.
nav
Modelos no lineales intrnsicamente lineales

Hay alguna tendencias que no son lineales pero con una adecuada transformacin de
variables se pueden transformar en lineales, por ejm tendencias exponenciales, potenciales,
logartmica, etc. El Spss tiene sas y otras tendencias en el men de regresin. Los siguientes
ejercicios son de ese tipo:
1. Los siguientes datos se refieren al crecimiento de una colonia de bacterias en un medio
de cultivo:
Das desde la inoculacin Nmero de bacterias (en miles)
x
y
3
6
9
12
15
18
115
147
239
356
579
864
a) Trace ln(yi) versus xi para verificar que es razonable una curva exponencial.
b) Ajuste una curva exponencial a los datos.
c) Estime el nmero de bacterias al trmino de 20 das.
2. Los siguientes datos se refieren a la demanda de un producto (en miles de unidades) y
su precio (en centavos) en cinco mercados diferentes:
Precio
X
Demanda
y
20
16
10
11
14
22
41
120
89
56
Ajuste una funcin potencial y sela para estimar la

demanda cuando el precio del producto es de 12 centavos.
3. Los siguientes datos se refieren al tiempo de secado de un cierto barniz y a la cantidad

de aditivo aadido para reducir el tiempo de secado:
Cantidad de aditivo
agregado (g)
Tiempo de
secado (horas)
x
0
1
2
3
4
5
6
7
8
y
12.0
10.5
10.0
8.0
7.0
8.0
7.5
8.5
9.0
a)
Dibuje un diagrama de dispersin para

verificar que es razonable suponer que la
relacin es parablica.
b) Ajuste un polinomio de segundo grado

con el mtodo de mnimos cuadrados.
nav
10
Regresin mltiple
Frmulas clave
Variables independientes
=(x1,x2,,xp)
Modelo de regresin mltiple
y=0 + 1x1 + 2x2 + . . . +pxp +
Ecuacin de regresin mltiple
Y/= E(y/ ) =0 + 1x1 + 2x2 +
Ecuacin de regresin mltiple estimada
Y = b0 + b1x1 + b2x2 + . . . +bpxp
Criterio de mnimos cuadrados
min ( yi yi )2
Relacin entre SCT, SCR y SCE
SCT = SCR + SCE
Coeficiente de determinacin mltiple
r2
. . . +pxp
SCE
SCR SCT SCE
=
1
SCT
SCT
SCT
ra2 1 (1 r 2 )
Coeficiente de determinacin mltiple ajustado
Cuadrado medio debido a la regresin
CMR
SCR
p
Cuadrado medio del error
CME
SCE
n p 1
Estadstico de la prueba F
CMR
CME
Estadstico de la prueba t
bi
Sbi
n 1
n p 1
nav
11
Modelo de regresin mltiple

El anlisis de regresin mltiple es el estudio de la forma en que una variable
dependiente, y, se relaciona con dos o ms variables independientes. En el caso
general emplearemos p para representar la cantidad de variables independientes.
y =0 + 1x1 + 2x2 + . . . +pxp +
El trmino del error explica la variabilidad en y que no puede explicar las p variables
independientes. El error es una variable aleatoria distribuida normalmente con media
cero y varianza constante,2, para todos los valores de las X i.
Si consideramos el valor medio de la variable y dadas las variables independientes
=(x1,x2,,xp), obtenemos la ecuacin de regresin lineal
Y/=E(y/ ) = 0 + 1x1 + 2x2 +
. . . +pxp
Utilizando los datos de una muestra de tamao n y el mtodo de mnimos cuadrados se

determina la ecuacin de regresin mltiple estimada:
Y = b0 + b1x1 + b2x2 + . . . +bpxp

Cada coeficiente b i representa una estimacin del cambio en y que corresponde a un
cambio unitario en x i cuando todas las dems variables independientes se mantienen
constantes.
Coeficiente de determinacin mltiple (r2)
r2 se interpreta como la proporcin de la variabilidad de la variable dependiente que se
puede explicar con la ecuacin de regresin mltiple.
SCE
SCR SCT SCE
1
=
r2
SCT
SCT
SCT
SCT: suma de cuadrados total
( yi y)2
SCR: Suma de cuadrados debida a la regresin ( yi y)2

SCE: Suma de cuadrados debida al error
( yi yi )2
Pruebas de significancia
Prueba F
H0 : 1 2 ... p 0
H1 : Uno o ms de los parmetrosno es cero

=0.05 es el nivel de significacin de la prueba.
FC
CMR
; CMR=SCE/p y CME=SCE/(n-p-1)
CME
Se rechaza H0 si el p-valor de FC es menor que .
nav
12
Los resultados se acomodan en una tabla ANOVA.

Tabla ANOVA
Fuente de
variacin
Regresin
Error
total
Suma de
cuadrados
SCR
SCE
SCT
Grados de
libertad
p
n-p -1
n-1
Cuadrados
medios
CMR=(SCR/p)
CME=(SCE/(n - p -1))
p-valor o
sig.
FC=CMR/CME
Prueba t para coeficientes individuales (i)
i 0
i 0
b
tc i ; con =n-p-1
Sbi
Se rechaza H0 si |tc| > t /2; o alternativamente, si p-valor de tc es menor que .
Multicolinealidad
En el anlisis de regresin hemos empleado el trmino variables independientes para
indicar cualquier variable que se usa para predecir o explicar el valor de la variable
dependiente. Sin embargo, el trmino no indica que las variables independientes sean
independientes entre s en un sentido estadstico. Al contrario, la mayor parte de las
variables independientes en un problema de correlacin mltiple se correlacionan en
cierto grado.
Tener un coeficiente de correlacin de la muestra mayor que 0.70 o menor que -0.70
para dos variables independientes es una regla fcil para advertir la posibilidad de
problemas por multicolinealidad.
Cuando las variables independientes estn muy correlacionadas no es posible
determinar el efecto separado de una de ellas sobre la variable dependiente.
Si es posible, se debe evitar incluir en el modelo, variables independientes que tengan
mucha correlacin. Sin embargo, en la prctica casi nunca es posible adherirse
estrictamente a este criterio.
Empleo de la ecuacin de regresin estimada para evaluar y predecir.

Podemos determinar intervalos de confianza para estimar la media de y e intervalos
de prediccin para estimar valores individuales de y.
Como ejemplo de anlisis de regresin mltiple describiremos un problema que se

present en la compaa Butler, una empresa dedicada a entregas de encomiendas.
Para poder contar con mejores programas de trabajo, se desea estimar el tiempo diario
total que viajan sus operarios. Se han considerado dos variables independientes que se
cree que influyen en el tiempo diario total. A continuacin se muestran los datos de una
muestra de 10 recorridos:
nav
Recorrido
1
2
3
4
5
6
7
8
9
10
13
millas
recorridas
(x1)
cantidad de
entregas
(x2)
tiempo de
recorrido en
horas (y)
100
9.3
50
4.8
100
8.9
100
6.5
50
4.2
80
6.2
75
7.4
65
6.0
90
7.6
90
6.1
Inicialmente analice el tiempo de recorrido en funcin de las millas recorridas y luego

incorpore la cantidad de entregas en el modelo. En cada caso analice tambin la
distribucin de residuales.
Cul es la ecuacin de regresin estimada en cada caso?
Cmo interpreta los coeficientes de regresin en cada modelo?
Cmo interpreta el coeficiente de determinacin mltiple r2?
En general, r2 aumenta siempre a medida que se agregan variables independientes al
modelo. Hay muchas personas que prefieren ajustar r2 de acuerdo con el nmero de
variables independientes, para evitar una sobreestimacin al agregar otras variables al
modelo estudiado.
ra2 1 (1 r 2 )
n 1
n p 1
Cunto vale ra2 en el ejemplo?.

Advirtase que cuando r2 es pequeo, el coeficiente ajustado puede asumir un valor
negativo; en este caso el programa de computadora ajusta en cero el valor de ese
coeficiente.
Estime, mediante un intervalo del 95% de confianza, la media del tiempo de viaje para
todos los camiones que recorren 100 millas y hacen dos entregas.
Estime, mediante un intervalo del 95% de confianza, el tiempo de viaje para un camin
que va a recorrer 100 millas y a hacer 2 entregas.
nav
14
Variables independientes cualitativas

Como hemos visto, las variables involucradas en problema de regresin son todas
variables numricas tanto las independientes como la dependiente. Sin embargo, en
muchas situaciones se debe incorporar al modelo variables cualitativas. El objetivo de
esta seccin es mostrar cmo se manejan este tipo de variables. Se crean unas
variables llamadas variables ficticias o indicadoras, las cuales slo pueden tomar dos
valores, 0 y 1.
Para ejemplificar el uso de estas variables consideremos el siguiente problema en la
empresa Jonson filtration, la cual se dedica al servicio de mantenimiento de sistemas
de filtrado de agua. Sus clientes se comunican solicitando servicio de mantenimiento en
sus sistemas de filtrado de agua. Para estimar el tiempo y el costo de servicios, la
gerencia desea predecir el tiempo necesario de reparacin para cada solicitud de
mantenimiento. Se cree que ese tiempo de reparacin se relaciona con dos factores: la
cantidad de meses transcurridos desde el ltimo servicio y el tipo de reparacin
(mecnica o elctrica). En la tabla se presentan los datos de una muestra de 10
rdenes de servicio:
rden de
servicio
Meses desde el
ltimo servicio
Tipo de
reparacin
Tiempo de
reparacin (horas)
elctrica
2.9
mecnica
3.0
elctrica
4.8
mecnica
1.8
elctrica
2.9
elctrica
4.9
mecnica
4.2
mecnica
4.8
elctrica
4.4
10
elctrica
4.5
Desarrolle un modelo que explique el tiempo de reparacin (Y) en funcin de los meses
desde el ltimo servicio (X1) y del tipo de reparacin (x 2).
Y=0 + 1 x1 + 2 x 2 +
Haga un anlisis de los resultados obtenidos, interprete los parmetros estimados.
Variables cualitativas ms complejas
Si una variable cualitativa tiene ms de dos niveles, se pueden definir varias variables
indicadoras para resolver el problema. En general se necesitan k-1 variables
indicadoras para incorporar una variable cualitativa con k niveles. Por ejm si una
variable tiene 3 niveles o categoras (A, B y C) se pueden crear dos variables ficticias
de la siguiente manera
categora
x1
x2
A
0
0
1 si es el nivel B
Con esta definicin
x1
B
1
0
tenemos los siguientes
0 si es cualquier otro
valores de x1 y x2.
C
0
1
1 si es el nivel C
x2
0 si es cualquier otro

Regresion Simple y Multiple

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Regresion Simple y Multiple

Cargado por

Copyright:

Formatos disponibles

nav

La ecuacin estimada de regresin (lineal simple)

En la regresin lineal simple, la grfica de la ecuacin de regresin se llama

poblacin estud. (miles)

poblacin estud. (miles)

El mtodo de mnimos cuadrados consiste en hallar los valores b0 y b1 que hacen

El coeficiente de determinacin (r2)

Suma de cuadrados total:

Suma de cuadrados debida a la regresin: SCR = (i - y )2

SCT = SCR + SCE

SCR SCT SCE

Expresado en porcentaje, se puede interpretar como el porcentaje de la variabilidad

poblacin estud. (miles)

clculo de SCE y SCT

La suma de cuadrados debida a la regresin se calcula por diferencia:

b1 es la pendiente la recta de regresin de y en x.

La ecuacin de regresin lineal simple indica que el valor medio o valor

El coeficiente de correlacin se define como

denominador es el producto de las desviaciones tpicas.

; SXY es la covarianza muestral y el

Cuadrados medios del error CME ( es una estimacin de 2)

Si sustituimos por su estimacin muestral, s, obtenemos un

estimador de b1 que denotaremos por sb1.

con =n-2 g.l.

Decisin: Se rechaza H0 en favor de H1 si |tc |> t 2 o si p-valor <

CME es un estimador insesgado de 2, mientras que CMR lo es slo si H0 es

Realiza la prueba del ejemplo usando ANOVA.

Uso de la ecuacin de regresin lineal para evaluar y predecir.

Intervalo de prediccin para estimar un valor individual de Y para un valor dado

xp= 10 ; p=60+5(10)=110 ; x =140/10 = 14 ; (x i x)2 = 568 ; n=10 ;

(xp x)2 =(10 14)2 =16 ; s CME

13.8293 ; t /2= 2.306

: 110 11.415 miles de dlares.

b) Se desea predecir, mediante un intervalo del 95% de confianza, las ventas

Modelos no lineales intrnsicamente lineales

Ajuste una funcin potencial y sela para estimar la

3. Los siguientes datos se refieren al tiempo de secado de un cierto barniz y a la cantidad

Dibuje un diagrama de dispersin para

b) Ajuste un polinomio de segundo grado

Modelo de regresin mltiple

y=0 + 1x1 + 2x2 + . . . +pxp +

Ecuacin de regresin mltiple

Y/= E(y/ ) =0 + 1x1 + 2x2 +

Ecuacin de regresin mltiple estimada

Y = b0 + b1x1 + b2x2 + . . . +bpxp

Criterio de mnimos cuadrados

Relacin entre SCT, SCR y SCE

SCT = SCR + SCE

Coeficiente de determinacin mltiple

Coeficiente de determinacin mltiple ajustado

Cuadrado medio debido a la regresin

Cuadrado medio del error

Modelo de regresin mltiple

Y/=E(y/ ) = 0 + 1x1 + 2x2 +

Utilizando los datos de una muestra de tamao n y el mtodo de mnimos cuadrados se

Y = b0 + b1x1 + b2x2 + . . . +bpxp

SCR: Suma de cuadrados debida a la regresin ( yi y)2

H1 : Uno o ms de los parmetrosno es cero

Se rechaza H0 si el p-valor de FC es menor que .

Los resultados se acomodan en una tabla ANOVA.

Prueba t para coeficientes individuales (i)

Empleo de la ecuacin de regresin estimada para evaluar y predecir.

Como ejemplo de anlisis de regresin mltiple describiremos un problema que se

Inicialmente analice el tiempo de recorrido en funcin de las millas recorridas y luego