Regresión Múltiple Interpretaciones

La desviación estándar de una estimación se denomina error estándar.
El error
estándar del coeficiente mide la precisión con la que el modelo estima el valor
desconocido del coeficiente. El error estándar del coeficiente siempre es positivo.
Utilice el error estándar del coeficiente para medir la precisión de la estimación del
coeficiente. Cuanto menor sea el error estándar, más precisa será la estimación.
Dependerá de las unidades de la variable dependiente y de la experiencia en la
interpretación.
El error estándar de la estimación mide la variabilidad o dispersión de los valores

muestrales y observados alrededor del plano de regresión.
¿Cómo interpretar el error estándar de estimación de $51.05?
Es el “error” típico cuando se emplea esta ecuación para predecir el costo.
Primero, las unidades son las mismas que en la variable dependiente, por lo cual el error
estándar es en dólares ($51.05).
Segundo, se espera que los residuos sean aproximados a una distribución más o menos
normal, por lo que alrededor de 68% de ellos estará dentro de ±$51.05 y cerca de 95%
dentro de ±$2(51.05) = ± $102.1 y así cerca del 99% está dentro ±$3(51.05) =±$153.15
Para comprender mejor recuerde:
Podemos medir aún con más precisión el porcentaje de observaciones que caen dentro de
un rango
Específico de una curva simétrica con forma de campana, como la mostrada en la figura en
estos casos podemos decir:
1. Aproximadamente 68% de los valores de la población cae dentro de ±1 desviación

estándar a partir de la media.
2. Aproximadamente 95% de los valores estará dentro de ±2 desviaciones estándar a partir
de la media.
3. Aproximadamente 99% de los valores estará en el intervalo que va desde 3 desviaciones
estándar a la izquierda de la media hasta 3 desviaciones estándar a la derecha de la media.
Coeficiente de determinación múltiple
En seguida, se considera el coeficiente de determinación múltiple. Recuerde, que el coeficiente
de determinación simple se define como el porcentaje de la variación de la variable dependiente
explicada, o contabilizada, por la variable independiente. En el caso de la regresión múltiple se
amplía esta definición, como sigue.
COEFICIENTE DE DETERMINACIÓN MÚLTIPLE Es el porcentaje de

variación de la variable dependiente, Y, explicada por el conjunto de variables
independientes, X1, X2, X3, …, Xk.
Las características del coeficiente de determinación múltiple son:

1. Se representa por una letra R mayúscula al cuadrado. En otras palabras, se escribe como
R debido a que se comporta como el cuadrado de un coeficiente de correlación.
2
2. Puede variar de 0 a 1. Un valor cercano a 0 indica poca asociación entre el conjunto de

variables independientes y la variable dependiente. Un valor cercano a 1 significa una
asociación fuerte.
3. No puede adoptar valores negativos. Ningún número que se eleve al cuadrado o se eleve a
la segunda potencia puede ser negativo.
4. Es fácil de interpretar. Como R2 es un valor entre 0 y 1 es fácil de interpretar, comparar y
comprender.
Coeficiente ajustado de determinación

El número de variables independientes de una ecuación de regresión múltiple aumenta
el coeficiente de determinación. Cada nueva variable independiente hace que las
predicciones sean más precisas, lo que a su vez reduce el SSE y aumenta el SSR. De
aquí, R2 aumenta sólo debido al número total de variables independientes y no porque la
variable independiente agregada sea un buen factor de predicción de la variable
dependiente.
De hecho, si el número de variables, k, y el tamaño de la muestra, n, son iguales, el
coeficiente de determinación es 1.0.
En la práctica, esta situación es poco frecuente y también sería éticamente cuestionable.

Para equilibrar el efecto del número de variables independientes en el coeficiente de
determinación múltiple, los paquetes de software estadísticos emplean un coeficiente de
determinación ajustado múltiple.
Análisis de residuales, supuestos del modelo

Gráficas
1 Prueba de normalidad de los de residuos para Costo calefacción
residuos
Gráfica de probabilidad normal vs. ajustes
99 100
N 20
AD 0.175
90 50
Valor p 0.912
Porcentaje
Residuo
50 0
10 -50
1 -100
-100 -50 0 50 100 0 100 200 300 400
Residuo Valor ajustado
Histograma
Los puntos deben estar cerca de la linea de 45°, o con la prueba devs. orden Darlin realizar la
Anderson
prueba
4 de hipótesis de normalidad. 100
3 50
Frecuencia
2 Prueba de homogeneidad de varianzas

Residuo
cas de residuos para

2
Costo calefacción 0
ad normal 1
vs. ajustes -50
100
N 20
0 -100
AD 0.175 -80 -40 0 40 80 2 4 6 8 10 12 14 16 18 20
Valor p 0.912 50
Residuo Orden de observación
Residuo
-50
-100
0 100 0 100 200 300 400
Valor ajustado
ama Los residuos deben seguir

vs.una linea o forma de banda, sin ningún patrón fijo.
orden
100
50
Residuo
-50
-100
40 80 2 4 6 8 10 12 14 16 18 20
uo Orden de observación
as de residuos para Costo calefacción
d normal vs. ajustes
100
N 20
AD 0.175
Valor p 0.912 50
Residuo
-50
3 Prueba
-100 de independencia
0 100 0 100 200 300 400
Valor ajustado
ama vs. orden

100
50
Residuo
-50
-100
40 80 2 4 6 8 10 12 14 16 18 20
uo Orden de observación
La prueba de independencia de los datos puede revisarse con la gráfica de orden de las
observaciones, la cual no debe tener ningún patrón observable para cumplir con la
prueba.
https://support.minitab.com/es-mx/minitab/21/help-and-how-to/statistical-modeling/
regression/how-to/fit-regression-model/interpret-the-results/all-statistics-and-graphs/
residual-plots/#residuals-versus-fits

Regresión Múltiple Interpretaciones

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Regresión Múltiple Interpretaciones

Cargado por

Copyright:

Formatos disponibles

La desviación estándar de una estimación se denomina error estándar.

El error estándar de la estimación mide la variabilidad o dispersión de los valores

¿Cómo interpretar el error estándar de estimación de $51.05?

Es el “error” típico cuando se emplea esta ecuación para predecir el costo.

Para comprender mejor recuerde:

1. Aproximadamente 68% de los valores de la población cae dentro de ±1 desviación

COEFICIENTE DE DETERMINACIÓN MÚLTIPLE Es el porcentaje de

Las características del coeficiente de determinación múltiple son:

2. Puede variar de 0 a 1. Un valor cercano a 0 indica poca asociación entre el conjunto de

Coeficiente ajustado de determinación

En la práctica, esta situación es poco frecuente y también sería éticamente cuestionable.

Análisis de residuales, supuestos del modelo

2 Prueba de homogeneidad de varianzas

cas de residuos para

ama Los residuos deben seguir

ama vs. orden

También podría gustarte