Está en la página 1de 7

Estadstica Aplicada

Captulo 1: Regresin Lineal Mltiple

1. Formulacin matricial del problema


2. Estimacin mnima cuadrtica. Propiedades de los
estimadores.
3. Estimacin de mxima verosimilitud
4. Inferencia en la regresin mltiple
5. Eficacia del modelo
6. Mtodos secuenciales para seleccin de variables
7. Estudios de residuos.
8. Anlisis de Varianza.
Captulo 2: Elementos del Muestreo

1. Generalidades: sondeos y censos.


2. Descripcin de una poblacin finita
3. Etapas de una encuesta: objetivos, cuestionarios,
recoleccin de datos y control
4. Muestreo probabilstica
5. Nociones de muestreo: casos particulares

Captulo 3: Principales tcnicas de sondeo

1. Muestreo
2. Muestreo
3. Muestreo
4. Muestreo

aleatorio simple.
estratificado
por conglomerado
en varias etapas
Viernes 2 de Octubre del 2015

Censo nacional econmico


Tipos de variables
Una frecuencia es para datos cualitativos
Descriptivas se realiza las cuantitativas variables cuantitativa discreta
Datos: segmentar archivo va a dividir los datos de la base de datos comparar grupos replicar
una encuesta del INEC
Famoso 1,96
Herramientas para anlisis, ir
con f9 se genera nuevamente los aleatorios.
Lunes 13 de Octubre del 2015

Modelo de Regresin Lineal Mltiple


n

: R R

( x 1 , x 2 , x n ) Y =F ( x 1 , x 2 , x n )= 0 + 1 x 1 + 2 x 2 + . + n x n
( x 1 , x 2 , x n ) = Regresores, Variables independientes.

F ( x 1 , x 2 , x n ) = Regresados, Variables dependientes.

Introduccin:
El modelo de RLM es uno de los mas conocidos y aplicados del denominado Anlisis
Multivariante. Por otra parte, constituye el ncleo a partir del cual se ha desarrollado la
Econometra.
El MRLM se aplica tanto a datos de corte transversal (es decir, en observaciones inferidos en
un mismo momento de tiempo como pueden ser los datos de encuestas a familias empresas,
etc) as como tambin a datos de (longitudinales) series de tiempo. En el contexto del anlisis
multivariante los datos que se utilizan suelen ser pronominantemente de corte transversal.

El MRLM y su estimacin por mnimos


cuadrados
En MRLM que vamos a presentar el se considera que el regresando (la variable y) es una
funcin lineal de k-1 regresores (variables independientes). Y de una perturbacin aleatoria,
existiendo adems un regresor ficticio correspondiente al trmino independiente (termino
que no va acompaado de ningn x).
Designamos por y(t) al regresando y por x(2t), x(3t).. x(kt) a los regresores y por U(t) a la
perturbacin aleatoria, el modelo terico de regresin lineal vienen dado por la observacin
genrica de t(-esima) as:
Xi
x
1
i

x
2

xn

t=
1
t=
2
Xi
Y
j
Xi
j

t=
T
Y t =1 + 2 x 2 t + 3 x3 t + 4 x 4 t + k1 x ( k1 ) kt + k x kt + t
t=1,2,3..,T
Siendo T el tamao de la muestra (filas) y dando valores a t desde t=1 hasta t=T se tiene el
siguiente sistema lineal de ecuaciones.
Y t =1 + 2 x 21 + 3 x 31+ 4 x 41 + k1 x (k1 )1 + k x k1 + 1
Y t =1 + 2 x 22 + 3 x 32+ 4 x 42 + k1 x (k1 )2 + k x k2 + 2
Y t =1 + 2 x 23 + 3 x 33+ 4 x 43 + k1 x ( k1) 3+ k x k 3 + 3
:
:

Y t =1 + 2 x 2 (T 1) + 3 x 3(T 1 )+ 4 x 4 (T1) + k1 x ( k1)(T 1 )+ k x k(T 1 )+ (T1)


Y t =1 + 2 x 2 T + 3 x3 T + 4 x 4 T + k1 x ( k1 ) T + k x kT + T

El sistema lineal de ecuaciones anterior se puede expresar de forma mas compacta utilizando
notacin matricial, as:

[] [

Y1
Y2
Y= : X=
:
YT

1 X 21
1 X 22
1 :
1 :
1 X 2T

X 31
X 32
:
:
X3T

] [] []

Xk 1
1
1
Xk 1
2
2
=
=
:
:
:
:
:
:
X kT
k
T

Tx1

Txk

kx1

Tx1

Entonces nuestro MRLM expresado en notacin matricial es el siguiente:

[ ][

Y1
1 X 21
Y2
1 X 22
: =1
:
:
1
:
YT
1 X2T

X 31
X 32
:
:
X3T

][ ] [ ]

X k 1 1 1
X k 1 2 2
:
: + :
:
:
:
X kT k T

Si tenemos en cuenta las denominaciones dadas a los vectores y matrices el MRLM se puede
expresar en forma compacta de la siguiente forma:
Y=X +

Donde Y es un vector Tx1,


X es una matriz TxK,
B es un vector Kx1; y,
U es un vector Tx1.
El correspondiente modelo ajustado (determinado a partir de los datos) ser:
Y^ = X ^

El vector de residuos es igual a la diferencia entre los valores observados y ajustados, esto es:

Denominando S a la suma de los cuadrados de los residuos se tiene lo siguiente

^ t ^=[ ^ 1 ^2 ^T ]

[]

^1
T
^2 = ^ 2
t
:
t =1
^ T

Teniendo en cuenta que :


^= y ^y
^= y x ^
Se obtiene :
t

S=( yx ^ ) ( yx ^)
Derivando S respecto al vector de coeficientes mnimo cuadrtico
tiene el siguiente sistema de ecuaciones:

^ e igualando a 0 se

x (x ^ y)=0
t

x t x ^x t y=0
x t x ^=x t y

Al sistema anterior se le denomina genricamente sistema de ecuaciones normales del


hiperplano.
Cuando K=2, se obtiene el sistema de ecuaciones normales de la recta.
Cuando K=3, se obtiene el sistema de ecuaciones normales del plano, y, cuando K>3 se
obtiene especficamente el sistema de ecuaciones normales del hiperplano, lo cual no es
susceptible de ser representado en el grfico.
En el matricial expandida, el sistema de ecuaciones normales es el siguiente:

x 2t

x2t

x 22t

:
:

:
:

:
:

x kt x 2 t

t=1
T

T
t =1

t =1
T

t=1

t=1

x 2t x kt
t=1

x kt

x kt
:
:
T

t=1

Para poder resolver el sistema

x 22 t
t=1

[] ] [
^
1
^

: =
:
^
k

x t x ^=x t y

Yt

t =1
T

X2 Y t
t=1

:
:
T

Xk Y t
t =1

respecto a

]
^

se debe cumplir que el rango

de la matriz x x sea igual a k (solucin nica).


Si cumple esta condicin se puede multiplicar ambos miembros por
x t x ^=x t y
t
1 t
t
1 t
^
( x x) x x =(x
x) x y
I ^=( x x ) x y
t

^=(x t x )1 x t y
16 de oct. de 15
Ho: no hay relacin lineal entre Y y los Xi
H1: Si hay relacin
Test para la verificacin con la prueba F
Ejercicio en el SPSS:
Ejercicio en Excel de la regresin lineal mltiple.
Optimizar la ecuacin de la produccin:

20 de oct. de 15
La empresa, Salsberry Realty vende casas en la costa este de Estados Unidos, una de las
preguntas que los posibles compradores hacen con mas frecuencia es: Si adquirimos esta casa
Cunto tendremos que pagar por la calefaccin en invierno?. Se le pidi al departamento de
investigacin de la compaa que elabore algunos lineamientos relacionados con los costos de
calefaccin para casas unifamiliares. Se consider que el costo incluye 3 variables

1. La temperatura media diaria en el exterior.


2. El espesor en pulgadas del material de aislamiento
trmico que se coloca en el desvn.
3. La antigedad del calefactor.

Para realizar esta investigacin el departamento en cuestin selecciono una muestra aleatoria
de 20 casas vendidas recientemente, determino el costo de la calefaccin de cada casa en el
mes de enero, la temperatura exterior en la regin, el espesor en pulgadas de material aislante
instalado en el desvn, y la antigedad del calefactor. A continuacin se presentan los datos
muestrales:
Datos:

Casa

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Costos
Temperat
Antige
de
Aislante
ura
dad
Calefacc
Trmico
Promedio
Calefact
in
(Pulgada
Exterior
or
(Dlares
s)
(F)
(Aos)
)
250
35
3
6
360
29
4
10
165
36
7
3
43
60
6
9
92
65
5
6
200
30
5
5
355
10
6
7
290
7
10
10
230
21
9
11
120
55
2
5
73
54
12
4
205
48
5
1
400
20
5
15
320
39
4
7
72
60
8
6
272
20
5
8
94
58
7
3
190
40
8
11
235
27
9
8
139
30
7
5

Determine la ecuacin de regresin mltiple.


Cules son las variables independientes
Las variables independientes son: La temperatura promedio exterior,

Cul es la variable dependiente


Analice los coeficientes de regresin.

Que indica el signo de los coeficientes es decir que


algunos sean positivos y otros negativos.
Cul es el valor de la interseccin.

Cul es el costo estimado para la calefaccin de una


casa si la temperatura media en el exteriores de 30 F,
hay 5 pulgadas de material aislante en el desvn y el
calefactor tiene 10 aos de antigedad.

También podría gustarte