Documentos de Académico
Documentos de Profesional
Documentos de Cultura
17
El procedimiento Selección del Modelo de Regresión está diseñado para ayudar a elegir las
variables independientes que se usarán para construir un modelo de regresión múltiple para predecir
una única variable dependiente Y. El procedimiento considera todas las posibles regresiones que
implican diferentes combinaciones de las variables independientes.
Compara los modelos con base en la R-Cuadrada ajustada, la estadística Cp de Mallows, y el
Cuadrado Medio del Error.
Resumen del Análisis
Presenta información sobre los datos de entrada y los modelos ajustados. La sección superior de la
salida indica el número de observaciones “n” y el número de modelos ajustados.
Mejor ajuste de R-Cuadrada
Esta tabla resume los modelos ajustados, ordenados de forma descendente con respecto a
la estadística R-cuadrada ajustada.
Mejor Cp
Esta tabla muestra los modelos, ordenados de forma descendente con respecto a la
estadística Cp:
Cp: Estadística Cp de Mallows.
Si el modelo ajustado tiene poco sesgo, la Cp debiera estar cerca de “p”. Es deseable
tener un valor pequeño de Cp, siempre que no sea mucho mayor que “p” en donde “p” es
el número de coeficientes en el modelo ajustado (incluyendo la constante). Debe buscar
modelos con valores de Cp cercanos a “p”. La gráfica de Cp, disponible de la lista de
Opciones Gráficas, contiene una línea igual a p para ayudarle a seleccionar los mejores
modelos.
Mejor criterio de información
Esta tabla ordena los modelos de regresión de acuerdo al valor del criterio de
información de Akaike (AIC). El criterio de información se basa en el error cuadrático
medio residual con una penalización que crece con el crecimiento del número de
coeficientes del modelo. La meta es seleccionar un modelo con el mínimo error residual
y con tan pocos coeficientes como sea posible. El mejor modelo es el que minimiza el
criterio de información. A menudo, el mejor modelo depende del criterio de
información seleccionado, cada uno de los cuales utiliza una fórmula diferente para la
penalización
Gráfica de R-Cuadrada Ajustada
Esta gráfica muestra los modelos con los valores más altos de R-Cuadrada ajustada.
La línea conecta los modelos con los mejores valores de R-cuadrada ajustada para cada
número de coeficientes. Advierta que la mejor R-cuadrada ajustada aumenta
notablemente hasta que el número de coeficientes es igual a 3 (correspondiendo a 2
variables independientes).
El MSE continúa cayendo hasta 3 coeficientes, después aumenta levemente. Pero por
el principio de Parsimonia, el modelo es mejor cuanto menos variables tiene. Vea el
grupo de a dos variables con menor MSE (AB, AD, AC)
Ajuste del Mejor Modelo
Si se juzga el modelo AD, es decir considerando las variables originales X1 y X4, como
el mejor, puede ajustarse con el procedimiento Regresión Múltiple, y hacer todo el
análisis que corresponda en esta parte.
29