Está en la página 1de 9

Campus Cerro Azul

Campus Cerro Azul

Campus Cerro Azul


Regresión lineal múltiple

El análisis de regresión lineal múltiple estudia la relación de una variable dependiente con dos
o más variables independientes.

A la ecuación que describe cómo está relacionada la variable dependiente y con las
variables independientes x1, x2, . . ., xk se le conoce como modelo de regresión lineal
múltiple. El modelo de regresión lineal múltiple está dado por:

El término del error corresponde a la variabilidad en y que no puede


atribuirse o explicarse al efecto lineal de las k variables independientes.

Campus Cerro Azul


Si se conocieran los valores se podría usar la ecuación del
modelo de regresión múltiple para calcular la media de las y para valores
dados de x1, x2, . . ., xk. Pero los valores de estos parámetros no suelen
conocerse, por lo que es necesario estimarlos a partir de datos muestrales.
Los valores para obtenidos de datos muestrales los
representamos como , . Con los valores muestrales se
obtiene la siguiente ecuación de regresión lineal múltiple estimada.

Donde :
son las estimaciones
es el valor estimado de la variable dependiente

EJERCICIO

Campus Cerro Azul


Pruebas de hipótesis en la regresión lineal múltiple:
Una vez que hemos encontrado el modelo (la línea recta), es necesario evaluar que tan
bien explica la relación entre X y Y. Una forma de hacerlo es probar una serie de hipótesis sobre
los parámetros del modelo

La hipótesis global sobre un modelo de regresión múltiple consiste en ver si la relación


entre las variables es significativa, esto se logra probando las siguientes hipótesis:

para al menos un j=1,2,…,k

Aceptar H0 significa que ningún término o variable en el modelo tiene una contribución
significativa al explicar la variable de respuesta Y. Mientras que rechazar H0 implica que por lo
menos un término en el modelo contribuye de manera significativa a explicar Y.
Tenemos dos maneras de evaluar ésta H0

1.- Comparando valor del estadístico 𝑭 (𝐹 0), contra el valor de distribución F encontrado en la
tabla correspondiente ( (∝, , ) ), por lo que

H0 se rechaza si 0 > ( , , ))

Donde:
𝛼 Es la significancia predefinida
k El número de variables analizadas
n El tamaño de la muestra

2.- Comparando la significancia observada, conocida como valor-p y la significancia


predefinida

H0 se rechaza si valor-p <

Campus Cerro Azul


Prueba sobre los coeficientes individuales
La siguiente hipótesis que podemos evaluar es la que nos sirve para valorar que tanto
contribuye cada término a la explicación de la variable de respuesta Y. Lo que nos permitiría
eliminar aquellos términos que tienen una contribución poco importante o quizá pensar en
agregar otras variables no consideradas.

La hipótesis se especifica de la siguiente manera:

j=0,1,2,…,k

Condición 1:
H0 se rechaza si ( / , )

Donde el valor de ( / , ) se obtiene de la tabla de distribución T de Student.

Condición 2:
H0 se rechaza si valor-p < 𝛼

Campus Cerro Azul


Coeficiente de Correlación múltiple ( R )

Es un indicador numérico de la relación lineal entre la variable Y y el conjunto de variables X; R


toma valores entre: –1 ≤ R ≤ 1

Valor de R Tipo de relación

Campus Cerro Azul


Coeficiente de determinación (R2)

Es una medida para la calidad del ajuste de la ecuación de regresión estimada.Toma


valores entre 0 < R2 ≤ 1

𝟐
Coeficiente de determinación ajustado ( 𝒂𝒋 )

Su función es muy parecida a la de R2 la diferencia está que cuando se van


incrementando las variables X, el 𝟐𝒂𝒋 es más exacto.
Se cumple que : 0 < 𝟐𝒂𝒋 ≤ R2 ≤ 1

Para hablar de un modelo que tiene un ajuste satisfactorio es necesario que ambos
coeficientes ( 𝟐𝒂𝒋 ≤ R2 ) tengan valores superiores a 0.7

Campus Cerro Azul

También podría gustarte