Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
REGRESION Y CORRELACIÓN MÚLTIPLE
2
Partimos de una tabla de datos de individuos por variables. Fundamentalmente
debiesen ser cuantitativas. Si hubiesen variables cualitativas, y que son de interés
considerarlas, ellas deben codificarse para transformarlas en cuantitativas y se
denominan variables “dummy”.
3
La Regresión Múltiple puede ser Lineal o No lineal (curvilínea)
4
5
6
USO DE SOFTWARE ESTADÍSTICO EN EL ANÁLISIS MULTIVARIANTES DE DATOS
7
8
9
10
Aplicación de análisis subjetivos y objetivos para la evaluación del Modelo de
Regresión
11
12
13
GRAFICOS UTILIZADOS EN EL DIAGNOSTICO SUBJETIVO
5.- Histogramas
14
Aplicación de análisis objetivos para la evaluación del
modelo de regresión
15
16
17
18
19
Coeficiente de Correlación Lineal Múltiple
20
Coeficiente de Correlación Parcial
21
22
23
1.- Ejemplos aplicando la regresión y correlación múltiple, donde todas las
variables predictoras son Cuantitativas. Uso de Statgraphics Centurión
XVI.1
Ejemplos
Ejemplo 1:
Datos en Archivo Excel “Índice de Adsorción” en la carpeta “Bases de Datos”
En la columna “TABLAS” del panel anterior, si selecciona la ventana “resumen del Análisis”,
obtendrá un interesante y orientador resumen del Método Estadístico Multivariante a
utilizar, según el objetivo que usted persigue
En la columna “GRAFICOS” del panel anterior, si selecciona la ventana “Matriz de
Dispersión” obtendrá un interesante y orientador gráfico del comportamiento
individual de cada variables (gráfico de Cajas” y del comportamiento entre pares de
variables.
Estando desplegado el gráfico “Matriz de Dispersión”, podemos presentar las
dispersiones suavizadas presionando el botón Suavizar/Rotar de la barra de
herramientas de análisis. La gráfica siguiente usa el suavizante por defecto LOWESS
Robusto:
El procedimiento contiene opciones adicionales para transformar los datos:
Esta tabla resume los modelos ajustados, ordenados de forma descendente con respecto a
la estadística R-cuadrada ajustada.
Mejor Cp
Esta tabla muestra los modelos, ordenados de forma descendente con respecto a la
estadística Cp:
Cp: Estadística Cp de Mallows.
Si el modelo ajustado tiene poco sesgo, la Cp debiera estar cerca de “p”. Es deseable
tener un valor pequeño de Cp, siempre que no sea mucho mayor que “p” en donde “p” es
el número de coeficientes en el modelo ajustado (incluyendo la constante). Debe buscar
modelos con valores de Cp cercanos a “p”. La gráfica de Cp, disponible de la lista de
Opciones Gráficas, contiene una línea igual a p para ayudarle a seleccionar los mejores
modelos.
Mejor criterio de información
Esta tabla ordena los modelos de regresión de acuerdo al valor del criterio de
información de Akaike (AIC). El criterio de información se basa en el error cuadrático
medio residual con una penalización que crece con el crecimiento del número de
coeficientes del modelo. La meta es seleccionar un modelo con el mínimo error residual
y con tan pocos coeficientes como sea posible. El mejor modelo es el que minimiza el
criterio de información. A menudo, el mejor modelo depende del criterio de
información seleccionado, cada uno de los cuales utiliza una fórmula diferente para la
penalización
Gráfica de R-Cuadrada Ajustada
Esta gráfica muestra los modelos con los valores más altos de R-Cuadrada ajustada.
La línea conecta los modelos con los mejores valores de R-cuadrada ajustada para cada
número de coeficientes. Advierta que la mejor R-cuadrada ajustada aumenta
notablemente hasta que el número de coeficientes es igual a 3 (correspondiendo a 2
variables independientes).
El MSE continúa cayendo hasta 3 coeficientes, después aumenta levemente. Pero por
el principio de Parsimonia, el modelo es mejor cuanto menos variables tiene. Vea el
grupo de a dos variables con menor MSE (AB, AD, AC)
Ajuste del Mejor Modelo
Si se juzga el modelo AD, es decir considerando las variables originales X1 y X4, como
el mejor, puede ajustarse con el procedimiento Regresión Múltiple, y hacer todo el
análisis que corresponda en esta parte.
1
El siguiente ejemplo ilustra el uso de las variables cualitativas en la Regresión
Múltiple. Supondremos para este ejemplo de que no existe interacción entre las
variables independientes.
Ejemplo:
Analizaremos la base de datos que está en base de Datos con el nombre “Datos 2015
DEPURADOS”, que corresponden a una prospección de un yacimiento en Perú.
Parte de esta base de datos se muestra a continuación. Nótese que la variable
“Alteración” se transformó en dos variables Dummy, AR1 y AR2
En primer lugar haremos una regresión simple entre el Au (Y) y el Cu X), para observar su
comportamiento respecto de un modelo lineal, separados por la variable “Alteración·”
Haremos una Regresión Múltiple utilizando los datos de la base de datos en Centurión
“Datos 2015 DEPURADOS”. La variable dependiente será Cu en función de las otras
variables cuantitativas como Ag, Au, Pb, etc.- y las variables Dummy, AR1 y AR2
(alteración)
Accediendo al Resumen del Análisis tenemos que se despliega la siguiente
tabla:
Para efectos de modelación estadística, las variables que mejor ayudan a predecir en
el modelo el comportamiento de la ley de Cu, son la ley Au, la Ag, Mo y las variables
Dummy AR1 y AR2.