Está en la página 1de 12

2.3.1 Mtodos cuantitativos para los pronsticos.

MTODOS CUANTITATIVOS
Los modelos cuantitativos de pronsticos son modelos matemticos que se basan en
datos histricos. Estos modelos suponen que los datos histricos son relevantes en el
futuro. Casi siempre puede obtenerse informacin pertinente al respecto. Aqu,
analizaremos varios modelos cuantitativos, la precisin del pronstico, pronsticos a largo
plazo y pronsticos a corto plazo.

Modelos cuantitativos de pronstico:


1.- Regresin lineal. Modelo que utiliza el mtodo de los mnimos cuadrados para
identificar la relacin entre una variable dependiente y una o ms variables
independientes, presentes en un conjunto de observaciones histricas. En la regresin
simple, solo hay una variable independiente; en la regresin mltiple, hay ms de una
variable independiente, en por ejemplo, un pronstico de ventas, son las ventas. Una
modelo de regresin no necesariamente tiene que estar basado en una serie de tiempo,
pues en estos casos el conocimiento de los valores futuros de la variable independiente
(llamada tambin variable causal) se utiliza para predecir valores futuros de la variable
dependiente. Por lo general, la regresin lineal se utiliza en pronsticos a largo plazo.

2.- Promedios mviles: Modelos de pronsticos del tipo de series de tiempo a corto plazo
que pronostica las ventas para el siguiente periodo. En este modelo, el pronstico
aritmtico de las ventas reales para un determinado nmero de los periodos pasados ms
recientes es el pronostico para el siguiente periodo.
3.- Promedio mvil ponderado: modelo parecido al modelo de promedio mvil arriba
descrito, excepto que el pronstico para el siguiente periodo es un promedio ponderado
de las ventas pasadas, en lugar del promedio aritmtico.

4.- Suavizacin exponencial: modelo tambin de pronstico de series de tiempo a corto


plazo que pronostica las ventas para el siguiente periodo. En este mtodo, las ventas
pronosticadas para el ltimo periodo se modifican utilizando la informacin

correspondiente al error de pronstico del ltimo periodo. Esta modificacin del pronstico
del ltimo periodo se utiliza como pronostico para el siguiente periodo.
5.- Suavizacin exponencial con tenencia. El modelo de suavizacin exponencial arriba
descrito, pero modificado para tomar en consideracin datos con un patrn de tendencia.
Estos patrones pueden estar presentes en datos a mediano plazo. Tambin se conoce
como suavizacin exponencial doble, ya que se suavizan tanto la estimacin del promedio
como la estimacin de la tendencia utilizando dos constantes de suavizacin.

Regresin Lineal Simple


Nos centraremos en primer lugar, en el caso de que la funcin que relaciona las dos
variables X e Y sea la ms simple posible, es decir, una lnea recta.
Por ello pasaremos a interpretar los coeficientes que determinan una lnea recta.
Toda funcin de la forma Y=a+bX determina, al representarla en el plano una lnea recta,
donde X e Y son variables y a y b son constantes. Por ejemplo: Y=3+2X.

SIGNIFICADO DE a y b
a es la ordenada en el origen, es decir, es la altura a la que la recta corta al eje Y. Se
denomina tambin trmino independiente.
b, tambin denominada pendiente es la inclinacin de la recta, es decir, es el incremento
que se produce en la variable Y cuando la variable X aumenta una unidad.
Por ejemplo, en el caso anterior Y=3+2X, por cada unidad que incrementa la X, la Y
presenta un incremento medio de 2 unidades.

En la recta de regresin -como ya veremos- b recibe el nombre de Coeficiente de regresin.


Si b>0, entonces cuando X aumenta Y tambin lo hace (relacin directa).
Si b<0, entonces, cuando X aumenta Y disminuye (relacin inversa).
Ver figura 6.4a y b respectivamente.

Figura 6.4: Signo de la pendiente en una recta de regresin

ESTIMACIN DE LA RECTA DE REGRESIN POR EL MTODO DE LOS


MNIMOS CUADRADOS
Sean X e Y dos variables aleatorias medidas sobre los mismos individuos, y sean (x i,yi) los
pares de observaciones sobre dichos individuos.
En primer lugar procederemos a representar el diagrama de dispersin, o nube de puntos.
Supongamos que es la obtenida en la figura 6.5. Aunque la nube revele una gran dispersin,
podemos observar una cierta tendencia lineal al aumentar X e Y (tendencia que no es del
todo exacta; por ejemplo si suponemos que X es la edad e Y es la talla, obviamente, la talla
no slo depende de la edad, adems tambin puede haber errores de medida).
Por esa nube de puntos podemos hacer pasar infinitas rectas. De todas ellas debemos elegir
una cual?... Obviamente elegiremos la mejor de todas en algn sentido.
La recta de regresin debe tener carcter de lnea media, debe ajustarse bien a la mayora de
los datos, es decir, pasar lo ms cerca posible de todos y cada uno de los puntos.
Llamaremos a la mejor de todas Y*=a+bX (Y* para distinguir los valores de la tabla de los
que se habran producido con la recta si la relacin fuese funcional).

Figura 6.5: Nube de puntos y posibles rectas que pueden pasar por ella.

Que pase lo ms cerca posible de todos los puntos, es decir que diste poco de todos y cada
uno de ellos significa que hemos de adoptar un criterio particular que en general se conoce
como MNIMOS CUADRADOS. Este criterio significa que la suma de los cuadrados de
las distancias verticales de los puntos a la recta debe ser lo ms pequea posible (ver figura
6.6). (Obviamente, este es uno de los posibles criterios a adoptar, pero es el ms utilizado).

Figura 6.6: Recta de regresin mostrando los residuos o errores que se minimizan
en el procedimiento de ajuste de los Mnimos cuadrados.

Estas distancias verticales se denominan errores o residuos.


Entonces el criterio puede expresarse:

Dado que la recta de regresin deber tener carcter de lnea media, esa suma de distancias
deber anularse (lo mismo que suceda, como veamos en la primera unidad didctica al
tratar de hallar la suma de las diferencias con respecto a la media aritmtica). Por las
mismas razones que entonces, para evaluar la dispersin, trabajaremos con esas distancias,
pero al cuadrado, de modo que la funcin que deberemos minimizar ser:

donde

son los valores estimados segn el modelo Y=a+bX

En la anterior expresin lo conocemos todo, excepto a y b. Para encontrar dichos valores,


con la condicin de que D sea mnima, deberemos hallar las derivadas parciales de D con
respecto a a y a b, y resolver el sistema resultante, al igualar las ecuaciones obtenidas a 0.
Es decir, el problema se reduce a un problema de mnimos.
As, obtendremos:

Adecuando convenientemente las ecuaciones anteriores, obtenemos:

Operando y reorganizando trminos, obtenemos las denominadas Ecuaciones Normales de


Gauss:

Resolviendo el sistema, obtenemos las expresiones para a y b:

La interpretacin de a y b, es anloga a la que comentbamos en el apartado 6.1.3.2, slo


que como ya dijimos entonces, b recibe el nombre de Coeficiente de Regresin.
Como podemos observar, en el numerador de b, aparece la covarianza, y en el denominador
la varianza de la variable independiente. Esto hace que el signo de b sea el mismo signo
que el de la covarianza, por lo que si b>0, entonces, existe una relacin directa entre las
variables, y si b<0 entonces la relacin es inversa.
En nuestro ejemplo de talla y edad, b sera el incremento medio que se produce en la talla,
por cada incremento unitario de edad; si la edad est en aos, por cada ao aumente la
edad.
Si queremos predecir un valor yi a partir de un valor concreto de xi, utilizaremos la
expresin de la ecuacin donde ahora ya, a y b son conocidos. No olvidemos que ese era
uno de los objetivos del anlisis, tratar de conocer valores de Y a partir de los de X:
y*i = a+bxi
REPRESENTATIVIDAD DE LA RECTA DE REGRESIN.
Poder explicativo del modelo
La recta de regresin, tiene carcter de lnea media, como ya se ha sealado con
anterioridad, tratando por lo tanto de resumir o sintetizar la informacin suministrada por
los datos.
Si tiene carcter de linea media (de promedio, en definitiva), deber ir acompaada siempre
de una medida que nos hable de su representatividad, es decir, de lo buena que es la recta,
ya que el haber obtenido la mejor de todas no da garantas de que sea buena.
Necesitamos, por tanto, una medida de dispersin, que tenga en cuenta la dispersin de
cada observacin con respecto a la recta, es decir, lo alejado que se encuentra cada punto de
la recta.
Es decir, deberemos evaluar esas distancias verticales a la recta, es decir, los errores o
residuales.

Si las dispersiones son pequeas, la recta ser un buen representante de la nube de puntos, o
lo que es lo mismo, la bondad de ajuste del modelo ser alta. Si la dispersin es grande, la
bondad de ajuste ser baja.
Una forma de medir dicha bondad de ajuste es precisamente evaluando la suma de los
cuadrados de los errores. Por tanto, llamaremos Varianza residual a la expresin:

Si la varianza residual es grande, el modelo ser malo, es decir, la recta no explicar el


comportamiento general de la nube.
La frmula prctica para el clculo de la varianza residual, si el procedimiento de ajuste es
el de los mnimos cuadrados es la siguiente:

La cota mxima de la varianza residual es la varianza que tratamos de explicar mediante el


modelo de regresin, es decir, la varianza de la variable dependiente. Por tanto, sin ms que
hacer relativa la varianza residual respecto de su mximo valor, y multiplicando por 100,
obtendremos el porcentaje de variaciones no explicado por el modelo:

Ahora, ya es fcil obtener una media que nos indique el porcentaje de variaciones
controladas o explicadas mediante el modelo, que se conoce como Coeficiente de
Determinacin, que denotaremos con R2. Su expresin en tantos por 1, ser:

Como puede observarse, a partir de la expresin anterior: 0< R2 <1. Por tanto:
Si R2=1, entonces no hay residuos, habr una dependencia funcional. Cuanto ms se
acerque dicho valor a la unidad, mayor poder explicativo tendr el modelo de regresin.

Si R2=0, X no explica en absoluto ninguna de las variaciones de la variable Y, de modo que


o bien el modelo es inadecuado, o bien las variables son independientes. Cuanto ms
cercano a 0 est dicho valor, menor poder explicativo.
Poder explicativo vs poder predictivo
Un modelo de regresin con un alto porcentaje de variaciones explicado, puede no ser
bueno para predecir, ya que el que la mayora de los puntos se encuentren cercanos a la
recta de regresin, no implica que todos lo estn, y puede ocurrir, que justamente para aquel
rango de valores en el que el investigador est interesado, se alejen de la recta, y por tanto,
el valor predecido puede alejarse mucho de la realidad.
La nica forma de poder evaluar el poder predictivo del modelo es tras la observacin y el
anlisis de los grficos de residuales, es decir, de diagramas de dispersin, en los que en el
eje de ordenadas se colocan los residuales, y en el eje de abscisas se colocan o bien X, Y, o
Y*.
Slo si la banda de residuales es homognea, y se encuentran todos los puntos no
demasiado alejados del 0 (aunque depende de la escala de medida), diremos, que un modelo con
un alto poder explicativo, tambin es bueno para predecir.
Un anlisis detallado de los residuales se realizar en la seccin 6.2.
CAUSALIDAD
Es muy importante resaltar el hecho, de que un modelo sea capaz de explicar de manera
adecuada las variaciones de la variable dependiente en funcin de la independiente, no
implica que la primera sea causa de la segunda.
Es un error muy comn confundir causalidad con casualidad. El hecho de que las variables
estn relacionadas no implica que una sea causa de la otra, ya que puede ocurrir el hecho de
que se est dando una variacin concomitante, por el simple hecho de que las dos son causa
de una tercera. Por ejemplo, si realizamos un estudio en el que se analice el nmero de
canas (X) y la presin arterial (Y), podramos encontrar una relacin lineal casi perfecta.
Eso no significa que el tener canas aumente la presin arterial, lo que verdaderamente est
ocurriendo es que es la edad, la causante, de que se tengan ms canas y una tendencia a
tener ms alta la presin arterial.

EXTRAPOLACIN
Es importante, resaltar el hecho de que a la hora de hacer predicciones, no deben
extrapolarse los resultados ms all del rango de la variable X utilizado para ajustar el
modelo, ya que ms all de ese rango no sabemos qu puede estar ocurriendo.
Por todos es conocido que las plantas necesitan abono para poder crecer. Desde pequeos
hemos aprendido que hay que abonarlas, de modo que en principio, cuanto ms abono se
les suministre ms crecern. Pero... qu ocurrira si abonsemos demasiado el suelo?.
Obviamente la planta morira. Bien, esto se traduce, en que conforme aumenta la cantidad
de abono, el crecimiento es ms notable, pero a partir de un punto, la planta deja de crecer,
y es ms se muere. Esto queda reflejado en la figura 6.7. De ah el peligro de extrapolar los
resultados.

También podría gustarte