Está en la página 1de 7

1

PREDICCIN: ECUACIN DE LA FUNCIN LINEAL



El modelo lineal de dos variables, o anlisis de regresin simple, se usa para probar hiptesis
sobre la relacin entre una variable dependiente Y, y una variable independiente o explicatoria
X, y tambin con fines predictivos; en Econometra se adiciona un trmino de error o de
perturbacin o estocstico (y = mX + b + u) el cual refleja el hecho de que en el mundo real, las
relaciones entre las variables socioeconmicas son inexactas y algo errticas; es decir, no
sera de esperar que la mayora de los valores observados de Y cayeran precisamente sobre
una lnea recta, o sea que todos los valores sean explicados perfectamente por la variable X,
sino que depende primariamente de ella, pero existen numerosas variable omitidas que afectan
el comportamiento de Y pero con un efecto tenue e irregular. Si fuera significativo este efecto,
entonces dicha variable debiera ser considerada y medida, se convierte entonces en una
regresin mltiple.

Al realizar la grfica de dispersin analizamos visualmente si puede o no existir cierta
correlacin de los datos, pero al realizar los clculos estadsticos de la recta ptima por
aproximacin de mnimos cuadrados ordinarios, minimizando la suma de los cuadrados de las
desviaciones verticales entre cada punto observado y la lnea recta, esta funcin o modelo
representa la recta ms aproximada a todos los puntos, y dependiendo de qu tan alto sea el
valor arrojado por los mnimos cuadrados, menor ser la correlacin existente y el trmino
estocstico cobrar mayor importancia.

Sin embargo, considero que el establecimiento de modelos busca encontrar la mejor
explicacin de la variable dependiente por las variables independientes analizadas para que el
dicho trmino estocstico tienda a cero. Por ende si definimos nuestro modelo de la forma ms
acercada a la realidad, el trmino estocstico tiende a cero, y por consecuencia a
desaparecer, y la constante u ordenada al origen del modelo seguir la misma regla, es decir
mientras nuestro modelo contenga mayor nmero de variables explicatorias y correctamente
medidas, nuestro modelo partir del origen del plano cartesiano, esto es, para los modelos de
comportamiento socioeconmico, si no hay una accin, no habr una reaccin.


2

Variables ficticias: Para la elaboracin de los modelos se emplean las cuales son variables
explicatorias cualitativas dicotmicas como el tiempo de guerra, perodo de huelga, sexo, etc. a
las cuales se les asigna valores de 1 0 y se manejan como cualquier otra variable.

Prediccin: La prediccin se refiere a la estimacin de una variable dependiente, dado el valor
observado o proyectado de la(s) variable(s) independiente(s). Cuando la prediccin se basa
sobre un valor estimado o proyectado y no sobre uno observado de la variable independiente,
tenemos una prediccin condicional. El trmino pronstico se usa frecuentemente como
equivalente de prediccin, y en otras se refiere a la estimacin de un valor intramuestral de la
variable dependiente, mientras que la prediccin se refiere a la estimacin de un valor futuro de
la variable dependiente.
Existen errores inherentes a las predicciones dadas por :
La naturaleza aleatoria del trmino estocstico o de error.
Los parmetros estimados que solo igualan a los parmetros verdaderos en el
promedio.
Los errores al proyectar las variables independientes.
La incorrecta especificacin del modelo.

La varianza de error de prediccin: s
2
F
, est dada por:
( )
( )
s
F
s
n
XF X
Xi X
2 2
1
1
2
2
= + +

(
(
(
(

Donde n es el nmero de observaciones, s
2
F
es la varianza estimada de error de prediccin y
( )
( ) 2
2


=
|
|
.
|

\
|
n
i
i Y Yi
s


3
Donde:
Yi valores reales
i valores estimados por mnimos cuadrados Y
=
=
_
_ _ _ _



El intervalo de confianza al 95 % para la prediccin de Y
F
, es donde
Y
Pred
(t
0.025
)(s
F
)
Donde el valor de t se encuentra en tablas con n-2 grados de libertad, y se emplea al 50% del
valor requerido de confianza por ser una sola cola.

De manera ilustrativa analicemos el siguiente ejemplo:
La siguiente tabla muestra las ventas de cierto producto en millones de pesos, Y, resultante del
empleo de la aplicacin de diferentes cantidades de recursos publicitarios en millones de pesos
por periodo, X, en una empresa en los aos 1981 - 1990:

Ao n Y
i
X
i


1981 1 40 6
1982 2 44 10
1983 3 46 12
1984 4 48 14
1985 5 52 16
1986 6 58 18
1987 7 60 22
1988 8 68 24
1989 9 74 26
1990 10 80 32


Con la utilizacin de calculadora electrnica encontramos que la ecuacin de aproximacin de
mnimos cuadrados que representa los datos anteriores es la siguiente:
Y = (1.659)X + 27.125



4
con un factor de correlacin r = 0.9854 y un factor de determinacin r
2
= 0.9710 97.10%,
(porcentaje de variacin en las ventas determinado por la variable explicatoria gasto
publicitario),es decir, que la ecuacin de regresin explica alrededor del 97% de la variacin
total de las ventas, y el 3% restante se atribuye a factores incluidos en el trmino de error.
Posteriormente se determina el cociente
( )
s
Yi Yi
i
n
2
2
2
=

|
\

|
.
|
|
\

|
.
|
|

(se determina aplicando el


modelo encontrado para cada valor de X el estimado de Y y se resta del valor observado de Y
elevado al cuadrado:




Ao Y
i
Y
iEst
e
i
e
i
2


1 40 37.08 2.92 8.5264
2 44 43.72 0.28 0.0784
3 46 47.04 -1.04 1.0816
4 48 50.36 -2.36 5.5696
5 52 53.68 -1.68 2.8224
6 58 57.00 1.00 1.0000
7 60 63.64 -3.64 13.2496
8 68 66.96 1.04 1.0816
9 74 70.28 3.72 13.8384
10 80 80.24 -0.24 0.0576
0 47.3056


( )
s
Yi Yi
i
n
2
2
2
473056
8
591 =

= =
|
\

|
.
|
|
\

|
.
|
|

.
.



5
Si proyectamos para 1991 una cantidad de gasto publicitario 35 millones de pesos, cules
sern las ventas esperadas?
( )
s s F
F
2
591 1
1
10
35 18
2
576
946 308 = + +

= =

(
(
(
. . .

Entonces encontramos que:

Y
Pred
= (27.125+1.659(35)) (2.31)(3.08) = 85.197.115 =
78.075<Y
Pred
>92.305 (intervalo de confianza del 95%)

COEFICIENTE DE CORRELACIN:

Ejemplo 1. Prediccin de ventas debidas a publicidad,
Supngase una compaa inici recientemente publicidad con un nuevo medio. El gerente de
marketing a registrado el gasto publicitario semanal (x) y los correspondientes volmenes de
ventas (y). Desea saber cual es el nivel esperado de ventas si la prxima semana se invierte en
publicidad us$ 3,250.00

Gasto Publicitario (x) Ventas Semanales (y)
1,000.00 101,000
1,250.00 126,000
1,500.00 163,000
2,000.00 194,000
2,500.00 209,000
3,250.00 ?


6

En este ejemplo el resultado es 274,517 unidades, con un valor del coeficiente de correlacin
de 0.964.
La correlacin es buena, pero el pequeo nmero puntos usados y la distancia entre 3,250 y
2,500 (ltimo valor registrado), lo convierten en menos significativo.

Significancia del coeficiente de correlacin.
Como se mencion en el ejemplo anterior, se trata de predecir el futuro basado solamente en
cinco puntos del pasado. En general, mientras menos sean los datos analizados, menos
confiable ser la prediccin.

Para saber que tan significativo es el coeficiente de correlacin se puede seguir el siguiente
procedimiento:
1. Determinar el nivel de certeza requerido para el coeficiente de correlacin.
2. Localizar el valor de r obtenido en la tabla siguiente, para el grado de certeza
seleccionado y el nmero de muestras usadas.
3. Si el valor del coeficiente de correlacin calculado es mayor que el valor en tablas,
podemos estar seguros, al nivel de certeza seleccionado, que el valor de r
calculado no es debido solo a la casualidad.
Para el ejemplo anterior, si deseamos un 95% de certeza, con cinco muestra empleadas, el
valor de tablas es 0.878.
El valor calculado es mayor que el de tablas, por lo que podemos asumir. con 95 % de
seguridad, que en realidad los valores analizados tienen una buena correlacin, la cual no es
debida a la casualidad.

Ejemplo 2. Supongamos que el gerente de ventas de una compaa est invirtiendo en una
serie de pruebas para medir el desempeo en ventas, y desea saber que tan correlacionados
estn las calificaciones con el desempeo en el campo.


7
Empleado Calificacin (x) Desempeo (y)
Lane 5 10
Bob 13 30
Britt 8 30
Ralph 10 40
Lana 15 60
Dae 20 50
Dennis 4 20
Patrick 16 60
Kathy 18 50
Kevin 6 20

Para este ejemplo, el valor del coeficiente de correlacin calculado es 0.866, y se considera
bueno (un coeficiente se considera bueno empricamente si se cumple:
(-0.7 s r > 0.7 )
Para determinar que tan significativa es la correlacin entre las calificaciones de la prueba, se
localiza en la tabla la fila correspondiente a 10 muestras, y se busca en ella, el valor de r ms
aproximado al calculado. En este caso 0.866 queda entre 0.765 y 0.872 (en tablas
estadsticas), por lo que podemos decir que tenemos una certeza entre 99 % y 99.99 % de que
la correlacin entre las calificaciones obtenidas en la prueba (por esos vendedores
nicamente), y el desempeo en ventas en campo, es buena y no se debe solo a la casualidad
este resultado.

También podría gustarte