Está en la página 1de 26

ESTADISTICA

APLICADA III
ANALISIS DE REGRESION
LINEAL MULTIPLE
MACHICAO BEJAR NILTON
ANÁLISIS DE REGRESIÓN MÚLTIPLE

El análisis de regresión consiste en emplear métodos que nos permitan


determinar la relación funcional entre las variables en estudio; de forma tal
que nos permita predecir el valor de una variable utilizando los valores que
correspondan a las otras variables.
REGRESIÓN LINEAL MÚLTIPLE
El análisis de regresión se usa por explicar o modelar la relación funcional
entre una variable Y , llamada respuesta, rendimiento o variable dependiente,
y una o más variables predictoras, o independientes o explicativas

x1, x2 , … xk.
La respuesta debe ser una variable continua pero las variables explicativas
pueden ser continuas, discretas o categóricas aunque se deja el manejo de
variables explicativas categóricas para otro curso.
REGRESIÓN LINEAL MÚLTIPLE

Los análisis de la regresión tienen varios posibles objetivos los cuales


incluyen:

1. La predicción de observaciones futuras.


2. La valoración del efecto de, o relación entre, variables explicativas y la
respuesta.
3. Una descripción general de estructura de los datos.
MODELO DE REGRESIÓN LINEAL MÚLTIPLE

El modelo de regresión lineal múltiple con k variables predoctoras


x1, x2 , … xk , es de la siguiente forma:

Donde:
x1, x2 , … xk , son variables independientes, fijadas y medidas sin error.
β0 , β1 , β2 , . . . βk son parámetros desconocidos. A β0 se le conoce con el
nombre de intercepto, y a los β1 , β2 , . . . βk se les llaman coeficientes de
regresión poblacional.
“ε” es una variable aleatoria no correlacionada y no observable tal que:

• β0 es la media de “y” cuando x1= x2 = . . . = xk = 0

• βj , para j = 1, 2, . . . , k indica el cambio promedio en la variable


dependiente “y” por unidad de cambio de “xj” , cuando las demás
variables independientes permanecen constantes.
ESTIMACIÓN DE LOS PARÁMETROS βJ
Para encontrar los estimadores de los coeficientes de regresión se aplica el
método de los mínimos cuadrados a partir de una muestra aleatoria de tamaño n.

ECUACIÓN DE LA LINEA DE REGRESIÓN MÚLTIPLE MUESTRAL

𝑦 = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 + 𝑏3 𝑥3 + ⋯ + 𝑏𝑘 𝑥𝑘 + 𝑒
Donde:
A b0 se le conoce con el nombre de intercepto muestral, y a los b1,b2, b3 , ... bk
se les llaman coeficientes de regresión muestral y e es el término del error o
perturbación aleatoria.
TEOREMA
Las estimaciones de mínimos cuadrados de los coeficientes de regresión
múltiple están dadas por:

Donde XT es la transpuesta de X y (XTX)-1 es la inversa de XTX

Además:
𝑏0
𝑏1
𝐵=

𝑏𝑘
EJERCICIO 1

Los siguientes datos Nº de Nº de Baños Precio (y)


muestran el número de Habitaciones (x1) (x2) (en dólares)

habitaciones, el número de 3 2 78 800


baños y los precios a los que 2 1 74 300
se vendieron hace poco 8 4 3 83 800
casas de una muestra 2 1 74 200
aleatoria de un distrito de 3 2 79 700
Lima: 2 2 74 900
5 3 88 400
4 2 82 900

Estime la ecuación de regresión lineal múltiple y prediga el precio de venta de


una casa de tres habitaciones con dos baños.
SOLUCIÓN

Sustituyendo
y n=8 en la matriz XTX, se obtiene:

Después, la inversa de esta matriz puede obtenerse a través de cualquiera de las


diferentes técnicas; aplicando una basada en el método de la adjunta, tenemos
que:
Donde 84 es el valor de 𝑋 𝑇 𝑋 , el determinante de XTX.

Al sustituir

en XTX, se obtiene:
y por último, reemplazando en:

B = (XTX)-1XTY

Entonces la ecuación de regresión lineal múltiple estimada es:


Reemplazando:

Esta ecuación nos permite predecir el precio de venta de una casa de tres
habitaciones (x1) con dos baño (x2).

Es decir una casa con 3 habitaciones y dos baños tienen un precio de 79 100
dólares aproximadamente.
EJERCICIO 2

Los siguientes datos constan del nivel de ventas que obtuvo la empresa “MACHI
SAC” durante cuatro meses del presente año; los gastos de publicidad por
televisión; y los gastos por publicidad en periódicos (todo en miles de dólares):

GASTOS PUBL.-TV GASTOS PUBL.-RADIO VENTAS


4 1 7
7 2 12
9 5 17
12 8 20

Determine la ecuación de regresión lineal múltiple estimada y prediga el nivel de


ventas de un mes en el cual se piensa invertir 15 y 10 mil dólares en publicidad
de televisión y radio respectivamente.
EJERCICIO 3

Los datos siguientes se refieren a las utilidades semanales (en miles de soles)
de 5 restaurantes, sus aforos (en decenas) y el tránsito diario en promedio (en
miles de automóviles) que pasan por sus ubicaciones:
TRANSITO UTILIDAD NETA
AFORO
DIARIO SEMANAL
2 1 3
3 2 4
1 1 2
4 3 5
4 2 2

Analice la información y calcule la línea de regresión múltiple estimada.


COEFICIENTE DE DETERMINACION: 𝑹𝟐
Mide la proporción de la variación total que es explicada por un modelo de
regresión. El coeficiente de determinación se usa como un indicador del grado de
bondad de ajuste, de un modelo de regresión, es decir si el modelo estimado
proporciona una buena explicación del comportamiento de la variable en estudio o
variable dependiente.
Este coeficiente es calculado del siguiente modo:

Donde:
SCR = suma de cuadrados de regresión
SCT = suma de cuadrados total
Donde:
ESTIMACION DE  POR MAXIMA VEROSIMILITUD
Además se cumple que:

;
Hallar al coeficiente de determinación y la desviación estándar del ejemplo 1

50907080000 − 50906394166
𝜎= = 292.8
8
PRUEBAS DE HIPÓTESIS
Estas pruebas acerca de parámetros se realizan para medir la adecuación del
modelo. Tal como se vio anteriormente, una prueba de hipótesis requiere que
los términos del error ei del modelo de regresión tengan una distribución normal
e independiente con media cero y variancia 2.

PRUEBA PARA LA SIGNIFICACION DE UNA REGRESION


La prueba de la significación de una regresión sirve para determinar si existe
una relación lineal entre la variable dependiente “y” y un conjunto de variables
independientes x1 , x2 , x3 , . . . , xk .

H0 : b1 = b2 = . . . = bk = 0
Ha : Al memos una de las bj es diferente de cero
Rechazar H0 implica que al menos una de las variables independientes
contribuye de manera significativa al modelo.
El estadístico para probar esta hipótesis es el “ F” definido por:

Se rechazara H0 si el valor calculado de F es mayor que el Ftabular = F(a, k, n-k-1)


CUADRO DE ANALISIS DE VARIANCIA (ANVA)

 Cuando se rechaza H0 se tiene que realizar pruebas individuales para los


bj , estas pruebas se realizan con el estadístico “t” de Student.
TEOREMA
Con las suposiciones del análisis de regresión lineal múltiple:

Son valores de variables aleatorias que tienen la distribución


“t” de Student con n - k -1 grados de libertad.

También podría gustarte