Está en la página 1de 3

REGRESIN LINEAL MLTIPLE La regresin lineal mltiple estima los coeficientes de la ecuacin lineal, con una o ms variables independientes,

que mejor prediga el valor de la variable dependiente. Por ejemplo, se puede intentar predecir el total de facturacin lograda por servicios prestados cada mes (la variable dependiente) a partir de variables independientes tales como: Tipo de servicio, edad, frecuencia del servicio, tipo de usuario y los aos de antigedad en el sistema del usuario.

ANALISIS DE REGRESION LINEAL MLTIPLE


Conceptualmente, el FIVi (Factor de incremento de la varianza) es la proporcin de variabilidad de la isima variable, que explican el resto de las variables independientes. La tolerancia de una variable es la proporcin de variabilidad de la variable, que no se explica por el resto de las variables independientes. La tolerancia y el FIV son muy tiles en la construccin de modelos de regresin. Si construimos un modelo paso a paso entrando las variables de una en una, es til conocer la tolerancia o el FIV de las variables independientes ya entradas en la ecuacin. De esta manera, las variables con mayor tolerancia son las que mayor informacin aportarn al modelo. Adems de la tolerancia y el FIV, debemos estudiar la matriz de correlaciones. Altas correlaciones entre las variables implicadas en el modelo deben considerarse como indicios de colinealidad. Puede ocurrir que, aun siendo pequeas las correlaciones entre las variables exista colinealidad. Supongamos que tenemos K variables independientes y construimos otra que sea la media de los valores de las otras K variables, en este caso la colinealidad ser completa, pero si K es grande, los coeficientes de correlacin sern pequeos. Por lo tanto, el estudio de la matriz de correlaciones no es suficiente. Una tcnica que cada vez se utiliza ms, aunque resulta algo sofisticada, es el anlisis de los autovalores de la matriz de correlaciones o de la matriz del producto cruzado. A partir de los autovalores, se puede calcular l INDICE DE CONDICIONAMIENTO IC tanto global del modelo como de cada variable. El ndice de condicionamiento, es la raz cuadrada del cociente entre el mximo y el mnimo autovalores. Si el IC es mayor que 30, existe colinealidad elevada, si el IC es mayor que 10 y menor que 30, la colinealidad es moderada, si el IC es menor que 10, no existe colinealidad. Tambin es interesante el ndice de condicionamiento para cada variable Ici, que es la raz cuadrada del cociente del mximo autovalor y el isimo autovalor. La varianza de cada coeficiente de regresin, incluida la constante, puede ser descompuesta como la suma de componentes asociadas a cada uno de los autovalores si el porcentaje de la varianza de algunos coeficientes de correlacin se asocia con el mismo autovalor, hay evidencia de colinealidad.

PASOS:

1. 2. 3. 4. 5. 6. 7. 8.

Identificar Xi, Y Construr diagrama de dispersin Estmar los parmetros del modelo. Probar la signifcancia Determinar la fuerza de la asociacin Verificar la exactitud de la prediccin Anlisis de residuales Validacin cruzada del modelo

EJEMPLO:

1. Este estudio se realiz para saber si existe alguna relacin que afecte el gasto de alimentacin mensual de una familia (Y) con las siguientes variables; el ingreso mensual (X1), el nmero de integrantes (X2) y el monto de ahorro por proyecto familiar (X3). Gasto en alimentos | Ingreso mensual | Integrantes de familia | Ahorro mensual | Y | X1 | X2 | X3 | 5000 | 10000 | 6 | 500 | 6000 | 45000 | 9 | 2000 | 2000 | 11000 | 5 | 1000 | 3000 | 12000 | 6 | 500 | 1500 | 10500 | 3 | 1000 | 5000 | 10000 | 6 | 2000 | 6000 | 24000 | 6 | 2000 | 3000 | 6000 | 3 | 1800 | 6000 | 45000 | 6 | 1500 | 5000 | 45500 | 5 | 3000 | Resultados usando Minitab. La ecuacin de regresin es Y = - 20 + 0.0169 X1 + 444 X2 + 0.890 X3 Predictor Coef SE Coef T Constante -20 1869 -0.01 X1 0.01686 0.04089 0.41 X2 444.1 323.1 1.37 X3 0.8896 0.7335 1.21 P 0.992 0.694 0.218 0.271

S = 1320.63 R-cuad. = 59.8% R-cuad.(ajustado) = 39.7% Anlisis de varianza Fuente GL Regresin 3 Error residual 6 Total 9 Fuente GL SC SC CM F P 15560690 5186897 2.97 0.119 10464310 1744052 26025000 Sec.

X1 1 X2 1 X3 1 Graficas

1111 7522 187 7963 256 5204

Conclusiones Como se puede notar el modelo de regresin se adecua un 39.7% siendo un porcentaje bajo de confiabilidad lo que quiere decir que el modelo tiene poca fiabilidad de ser adecuado a la situacin adems de una P de .119 de aceptacin. Por lo que me queda claro que las variables juntas son muy difciles de comparar pero que si se hiciera una regresin de la variable y con cada una de las variables x podra que la relacin sea ms precisa para observar

También podría gustarte