Está en la página 1de 5

La desviación estándar de una estimación se denomina error estándar.

El error
estándar del coeficiente mide la precisión con la que el modelo estima el valor
desconocido del coeficiente. El error estándar del coeficiente siempre es positivo.

Utilice el error estándar del coeficiente para medir la precisión de la estimación del
coeficiente. Cuanto menor sea el error estándar, más precisa será la estimación.
Dependerá de las unidades de la variable dependiente y de la experiencia en la
interpretación.

El error estándar de la estimación mide la variabilidad o dispersión de los valores


muestrales y observados alrededor del plano de regresión.

¿Cómo interpretar el error estándar de estimación de $51.05?

Es el “error” típico cuando se emplea esta ecuación para predecir el costo.

Primero, las unidades son las mismas que en la variable dependiente, por lo cual el error
estándar es en dólares ($51.05).
Segundo, se espera que los residuos sean aproximados a una distribución más o menos
normal, por lo que alrededor de 68% de ellos estará dentro de ±$51.05 y cerca de 95%
dentro de ±$2(51.05) = ± $102.1 y así cerca del 99% está dentro ±$3(51.05) =±$153.15

Para comprender mejor recuerde:

Podemos medir aún con más precisión el porcentaje de observaciones que caen dentro de
un rango
Específico de una curva simétrica con forma de campana, como la mostrada en la figura en
estos casos podemos decir:

1. Aproximadamente 68% de los valores de la población cae dentro de ±1 desviación


estándar a partir de la media.
2. Aproximadamente 95% de los valores estará dentro de ±2 desviaciones estándar a partir
de la media.
3. Aproximadamente 99% de los valores estará en el intervalo que va desde 3 desviaciones
estándar a la izquierda de la media hasta 3 desviaciones estándar a la derecha de la media.
Coeficiente de determinación múltiple
En seguida, se considera el coeficiente de determinación múltiple. Recuerde, que el coeficiente
de determinación simple se define como el porcentaje de la variación de la variable dependiente
explicada, o contabilizada, por la variable independiente. En el caso de la regresión múltiple se
amplía esta definición, como sigue.

COEFICIENTE DE DETERMINACIÓN MÚLTIPLE Es el porcentaje de


variación de la variable dependiente, Y, explicada por el conjunto de variables
independientes, X1, X2, X3, …, Xk.

Las características del coeficiente de determinación múltiple son:


1. Se representa por una letra R mayúscula al cuadrado. En otras palabras, se escribe como
R debido a que se comporta como el cuadrado de un coeficiente de correlación.
2

2. Puede variar de 0 a 1. Un valor cercano a 0 indica poca asociación entre el conjunto de


variables independientes y la variable dependiente. Un valor cercano a 1 significa una
asociación fuerte.
3. No puede adoptar valores negativos. Ningún número que se eleve al cuadrado o se eleve a
la segunda potencia puede ser negativo.
4. Es fácil de interpretar. Como R2 es un valor entre 0 y 1 es fácil de interpretar, comparar y
comprender.

Coeficiente ajustado de determinación


El número de variables independientes de una ecuación de regresión múltiple aumenta
el coeficiente de determinación. Cada nueva variable independiente hace que las
predicciones sean más precisas, lo que a su vez reduce el SSE y aumenta el SSR. De
aquí, R2 aumenta sólo debido al número total de variables independientes y no porque la
variable independiente agregada sea un buen factor de predicción de la variable
dependiente.
De hecho, si el número de variables, k, y el tamaño de la muestra, n, son iguales, el
coeficiente de determinación es 1.0.

En la práctica, esta situación es poco frecuente y también sería éticamente cuestionable.


Para equilibrar el efecto del número de variables independientes en el coeficiente de
determinación múltiple, los paquetes de software estadísticos emplean un coeficiente de
determinación ajustado múltiple.

Análisis de residuales, supuestos del modelo


Gráficas
1 Prueba de normalidad de los de residuos para Costo calefacción
residuos
Gráfica de probabilidad normal vs. ajustes
99 100
N 20
AD 0.175
90 50
Valor p 0.912
Porcentaje

Residuo
50 0

10 -50

1 -100
-100 -50 0 50 100 0 100 200 300 400
Residuo Valor ajustado

Histograma
Los puntos deben estar cerca de la linea de 45°, o con la prueba devs. orden Darlin realizar la
Anderson
prueba
4 de hipótesis de normalidad. 100

3 50
Frecuencia

2 Prueba de homogeneidad de varianzas


Residuo

cas de residuos para


2
Costo calefacción 0

ad normal 1
vs. ajustes -50
100
N 20
0 -100
AD 0.175 -80 -40 0 40 80 2 4 6 8 10 12 14 16 18 20
Valor p 0.912 50
Residuo Orden de observación
Residuo

-50

-100
0 100 0 100 200 300 400
Valor ajustado

ama Los residuos deben seguir


vs.una linea o forma de banda, sin ningún patrón fijo.
orden
100

50
Residuo

-50

-100
40 80 2 4 6 8 10 12 14 16 18 20
uo Orden de observación
as de residuos para Costo calefacción
d normal vs. ajustes
100
N 20
AD 0.175
Valor p 0.912 50
Residuo

-50

3 Prueba
-100 de independencia
0 100 0 100 200 300 400
Valor ajustado

ama vs. orden


100

50
Residuo

-50

-100
40 80 2 4 6 8 10 12 14 16 18 20
uo Orden de observación

La prueba de independencia de los datos puede revisarse con la gráfica de orden de las
observaciones, la cual no debe tener ningún patrón observable para cumplir con la
prueba.
https://support.minitab.com/es-mx/minitab/21/help-and-how-to/statistical-modeling/
regression/how-to/fit-regression-model/interpret-the-results/all-statistics-and-graphs/
residual-plots/#residuals-versus-fits

También podría gustarte