Documentos de Académico
Documentos de Profesional
Documentos de Cultura
pronósticos
para la toma
de decisiones
Si el ajuste es pobre, debe descartarse el modelo lineal y buscar otro. Una importante aplicación del modelo
de regresión es la predicción de nuevas observaciones de Y correspondientes a un valor dado de X. Si X0 es el
valor de interés, entonces:
Ŷ = b0 + b1X0
La línea de regresión puede usarse para estimar el valor de Y para un valor determinado X. Para obtener una
predicción puntual o pronóstico, simplemente evalúe la función de regresión estimada en X.
X=3 Y=6
Ŷ0 = 3.75 + 0.75 X0
Ŷ0 = b0 + b1X0
= 3.75 + 3
= 6.75
Existen dos fuentes de incertidumbre asociadas con una predicción puntual generada por la ecuación de re-
gresión adaptada:
Es posible elaborar un intervalo de predicción de Y que tome en cuenta estas dos fuentes de incertidumbre. El
error estándar del pronóstico mide la variabilidad de Y prevista sobre la Y real para un valor determinado de X.
El error estándar del pronóstico está dado por la expresión:
( )
2
2 1 X0 + X
S +
ε n 2
∑ X2 − n X ( )
El primer término, S2ε, mide la dispersión de los datos sobre la línea de regresión de la muestra (primera
fuente de incertidumbre).
El segundo término:
( )
2
2 2 1 X + X
S +S +
0
ε n 2
ε
∑ X2 − n X ( )
Muy frecuentemente, el interés fundamental de un análisis de regresión se ubica en predecir el valor esperado
de Y para valores específicos de X, es decir, para un valor dado de X = X0. Este intervalo se denomina a menudo
intervalo de predicción del (1 - α) 100%, y se obtiene como sigue:
( )
( )
2 2
2 2 1 X − X X − X
S +S +
0 = S 2 1+ 1 + 0
ε n 2
( ) ( )
2
ε ε n
∑ X2 − n X
∑ X2 − n X
Con t* = tα2, (n -2) s
Puesto que:
(X
)
2
1 −X
±t*S
Y 1+ +
0
∑ X − n ( X)
ε 2
n 2
Donde X0 es el valor dado de X; además Ŷ = b0 + b1X0. Para el ejemplo anterior, si X0 = 4, entonces, un intervalo
de confianza al 95% para Ŷ = 6.75 será:
1 ( 4 − 3)
2
1+ +
4 8
Entonces:
Sε =
∑Y 2
− b0 ∑ Y − b1 ∑ XY
6.75 ± 4.303 (0.8660) n−2
150 − ( 3.75 )( 24 ) − ( 0.75 )( 78 )
=
4−2
6.75 ± 4.3696
En donde:
(X )
2
−X
± t * S 1+ 1 +
Y
0
∑ X − n ( X)
ε 2
n 2
=0.8660
En general, es peligroso utilizar la función de regresión ajustada para predecir valores de Y más allá del rango
de valores disponibles. Se puede justificar que se trate de predecir Y cuando X = 4 porque algunos de los va-
lores originales de X están cerca de 4. Por otro lado, podría ser imprudente predecir Y cuando X = 10, pues
no se han recopilado datos para X tan grandes, y por esta razón cualquier predicción que implique tal valor de
X sería muy dudosa. Para calcular el gasto cuando la antigüedad es de 10 años, tiene que suponerse que el
modelo de línea recta es aún válido; puede haber buenas razones para pensar así, pero no se tiene evidencia
directa para respaldar tal suposición.
Análisis de residuos
El hecho de ajustar un modelo por mínimos cuadrados, construir intervalos de predicción y probar hipótesis, no
completa el estudio de regresión. Estos pasos son solamente la mitad de la historia: las inferencias que se pu-
eden hacer cuando los supuestos del modelo se cumplen de manera adecuada. En la mayoría de los estudios
no es obvio que un modelo en particular sea correcto. Las inferencias pueden ser seriamente engañosas si los
supuestos elaborados en la formulación del modelo son extremadamente incompatibles con los datos.
1 2 3 4
En la población existe Los términos de error La dispersión de los Para un valor de-
una relación lineal son independientes datos poblacionales terminado de X, la
entre X y Y. También uno del otro. Este su- alrededor de la línea población de valores
hay extensiones de puesto implica que la de regresión de la de Y es normalmente
la regresión lineal muestra de datos X-Y población permanece distribuida sobre la
simple para tratar las es aleatoria. Cuando constante a lo largo línea de regresión de
relaciones X-Y que no los datos X-Y son reg- de la línea. La vari- la población. En la
son lineales. istrados a lo largo del anza de la población práctica, se obtienen
tiempo, a menudo se no se hace ni más resultados razon-
viola este supuesto. grande ni más peque- ablemente precisos
Más que ser indepen- ña, aunque los va- mientras los valores
dientes, las observa- lores X de los puntos Y se distribuyan de
ciones consecutivas aumenten. manera razonable-
están correlacionadas mente normal.
serialmente.
La información sobre la variación que no se puede explicar por la función de regresión ajustada se encuentra en
los residuales e = Y - Ŷ. Para verificar los méritos de un modelo tentativo, se pueden examinar diversas gráficas
de residuales.
15
12
frecuencia
6
3
0
-3 -2 -1 0 1 2 3
res_est
Información obtenida de http://www.udc.es/.../. Sólo para fines educativos.
10 *
* * * ** **
*
****** ** ***
*
* * **** ** ** *** * * *
* *** * * ** **** ** *********** *** ***************
0
*** **** * * *** *** ****** ****
***** * ***** **
residuos
* ** * ** ****
** *** ******* *** ************* *******
* ** * * * ** * **
* * ***
-10
*
-20
-2 0 2 4 6 8 10 12
predicciones
Información obtenida de http://www.udc.es/.../. Sólo para fines educativos.
Residuales 0
-2
-4
-6
8 10 12 14 16 18 20 22
Variable explicativa (x)
Información obtenida y modificada de http://tabarefernandez.tripod.com/.../. Sólo para fines educativos.
Para residuales de series de tiempo, es decir, residuales producidos utilizando métodos de re-
gresión en datos ordenados por tiempo, se puede verificar la independencia mediante una gráfica de
residuales sobre el tiempo. Si hay independencia no debe haber un patrón sistemático, tal como un
conjunto de valores consecutivos altos, seguido por otro de valores bajos. Además, cuando se calcu-
lan las autocorrelaciones muestrales de los residuales se puede verificar la independencia. Este tema
de la autocorrelación ya se trató en el tema 6 del módulo anterior.
6
5
4
3
2
Residuacles
1
0
5 10 15 20 25
-1
Tiempo
-2
-3
-4
-5
-6
3
*** ***
2 ******** * ****
* * ***** **
* * *
*** ** ******** ***** *
1
** ** * * * ** *** * **
*** ******************** **** **** *******************
***** ** ** * * * *
Residuos
0
************************************************* ** ***** ***
************************* ********
* ************************* * *
-1
********** ***
****
-2
* *** *
*
-3
0 2 4 6 8
Valores estimados
Imagen obtenida y modificada de https://encrypted-tbn1.gstatic.com/.../. Sólo para fines educativos.
Referencias bibliográficas
Hanke, J. E., y Wichern, D. W. (2010). Pronósticos en los negocios (9ª ed.). México: Pearson.
Levin, R., y Rubin, D. (2010). Estadística para administración y economía (7ª ed.). México. Pearson
educación.
Rodríguez, J., Pierdant, E., y Rodríguez, C. (2016). Estadística para administración (2ª ed.). México:
Editorial Patria.