Está en la página 1de 22

ESTADISTICA

INFERENCIAL
ANALISIS DE REGRESION MULTIPLE

MACHICAO BEJAR NILTON


ANÁLISIS DE REGRESIÓN MÚLTIPLE

El análisis de regresión consiste en emplear métodos que nos permitan


determinar la relación funcional entre las variables en estudio; de forma tal
que nos permita predecir el valor de una variable utilizando los valores que
correspondan a las otras variables.
REGRESIÓN LINEAL MÚLTIPLE
El análisis de regresión se usa por explicar o modelar la relación funcional
entre una variable Y , llamada respuesta, rendimiento o variable dependiente,
y una o más variables predictoras, o independientes o explicativas

x1, x2 , … xk.
La respuesta debe ser una variable continua pero las variables explicativas
pueden ser continuas, discretas o categóricas aunque se deja el manejo de
variables explicativas categóricas para otro curso.
REGRESIÓN LINEAL MÚLTIPLE

Los análisis de la regresión tienen varios posibles objetivos los cuales


incluyen:

1. La predicción de observaciones futuras.


2. La valoración del efecto de, o relación entre, variables explicativas y la
respuesta.
3. Una descripción general de estructura de los datos.
MODELO DE REGRESIÓN LINEAL MÚLTIPLE

El modelo de regresión lineal múltiple con k variables predoctoras


x1, x2 , … xk , es de la siguiente forma:

Donde:
x1, x2 , … xk , son variables independientes, fijadas y medidas sin error.
β0 , β1 , β2 , . . . βk son parámetros desconocidos. A β0 se le conoce con el
nombre de intercepto, y a los β1 , β2 , . . . βk se les llaman coeficientes de
regresión poblacional.
“ε” es una variable aleatoria no correlacionada y no observable tal que:

• β0 es la media de “y” cuando x1= x2 = . . . = xk = 0

• βj , para j = 1, 2, . . . , k indica el cambio promedio en la variable


dependiente “y” por unidad de cambio de “xj” , cuando las demás
variables independientes permanecen constantes.
ESTIMACIÓN DE LOS PARÁMETROS βJ
Para encontrar los estimadores de los coeficientes de regresión se aplica el
método de los mínimos cuadrados a partir de una muestra aleatoria de tamaño n.

ECUACIÓN DE LA LINEA DE REGRESIÓN MÚLTIPLE MUESTRAL

𝑦 = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 + 𝑏3 𝑥3 + ⋯ + 𝑏𝑘 𝑥𝑘 + 𝑒

Donde:
A b0 se le conoce con el nombre de intercepto muestral, y a los b1,b2, b3 , ... bk
se les llaman coeficientes de regresión muestral y e es el término del error o
perturbación aleatoria.
TEOREMA
Las estimaciones de mínimos cuadrados de los coeficientes de regresión
múltiple están dadas por:

Donde XT es la transpuesta de X y (XTX)-1 es la inversa de XTX

Además:
𝑏0
𝑏1
𝐵=

𝑏𝑘
EJERCICIO 1

Los siguientes datos Nº de Nº de Baños Precio (y)


muestran el número de Habitaciones (x1) (x2) (en dólares)

habitaciones, el número de 3 2 78 800


baños y los precios a los que 2 1 74 300
se vendieron hace poco 8 4 3 83 800
casas de una muestra 2 1 74 200
aleatoria de un distrito de 3 2 79 700
Lima: 2 2 74 900
5 3 88 400
4 2 82 900

Estime la ecuación de regresión lineal múltiple y prediga el precio de venta de


una casa de tres habitaciones con dos baños.

Datos/Observaciones
SOLUCIÓN

Sustituyendo
y n=8 en la matriz XTX, se obtiene:

Después, la inversa de esta matriz puede obtenerse a través de cualquiera de las


diferentes técnicas; aplicando una basada en el método de la adjunta, tenemos
que:

Datos/Observaciones
Donde 84 es el valor de 𝑋 𝑇 𝑋 , el determinante de XTX.

Al sustituir

en XTX, se obtiene:

Datos/Observaciones
y por último, reemplazando en:

B = (XTX)-1XTY

Entonces la ecuación de regresión lineal múltiple estimada es:

Datos/Observaciones
Reemplazando:

Esta ecuación nos permite predecir el precio de venta de una casa de tres
habitaciones (x1) con dos baño (x2).

Es decir una casa con 3 habitaciones y dos baños tienen un precio de 79 100
dólares aproximadamente.

Datos/Observaciones
EJERCICIO 2

Los siguientes datos constan del nivel de ventas que obtuvo la empresa “MACHI
SAC” durante cuatro meses del presente año; los gastos de publicidad por
televisión; y los gastos por publicidad en periódicos (todo en miles de dólares):

GASTOS PUBL.-TV GASTOS PUBL.-RADIO VENTAS


4 1 7
7 2 12
9 5 17
12 8 20

Determine la ecuación de regresión lineal múltiple estimada y prediga el nivel de


ventas de un mes en el cual se piensa invertir 15 y 10 mil dólares en publicidad
de televisión y radio respectivamente.

Datos/Observaciones
EJERCICIO 3

Los datos siguientes se refieren a las utilidades semanales (en miles de soles)
de 5 restaurantes, sus aforos (en decenas) y el tránsito diario en promedio (en
miles de automóviles) que pasan por sus ubicaciones:

TRANSITO UTILIDAD NETA


AFORO
DIARIO SEMANAL
2 1 3
3 2 4
1 1 2
4 3 5
4 2 2

Analice la información y calcule la línea de regresión múltiple estimada.

Datos/Observaciones
COEFICIENTE DE DETERMINACION: 𝑹𝟐
Mide la proporción de la variación total que es explicada por un modelo de
regresión. El coeficiente de determinación se usa como un indicador del grado de
bondad de ajuste, de un modelo de regresión, es decir si el modelo estimado
proporciona una buena explicación del comportamiento de la variable en estudio o
variable dependiente.
Este coeficiente es calculado del siguiente modo:

Donde:
SCR = suma de cuadrados de regresión
SCT = suma de cuadrados total
Donde:
ESTIMACION DE  POR MAXIMA VEROSIMILITUD
Además se cumple que:

;
Hallar al coeficiente de determinación y la desviación estándar del ejemplo 1

50907080000 − 50906394166
𝜎ො = = 292.8
8

También podría gustarte