Está en la página 1de 7

Técnicas cuantitativas de predicción:

Las técnicas cuantitativas de predicción poseen la ventaja de que, al estar expresadas


matemáticamente, su procedimiento de cálculo y los supuestos empleados carecen de toda
ambigüedad.

Dos grupos se identifican en esta categoría: los modelos causales y los modelos de series de
tiempo. Un tercero, el de datos de panel, es solo una combinación de los dos anteriores. Por
ejemplo, en un proyecto de atenciones pediátricas, un modelo causal vincularía el número de
prestaciones médicas con la cantidad de niños de cada zona geográfica; uno de series de tiempo
analizaría la evolución en el tiempo del número de prestaciones; y uno de datos de panel
relacionaría la evolución de la población infantil con el número de atenciones pediátricas a través
del tiempo.

Modelos causales:

Los modelos causales requieren que exista una relación entre los valores de ambas variables y que
los de la variable independiente sean conocidos o que su estimación otorgue una mayor confianza.
La forma más común de hacer proyección causal es el ajuste de curvas, el cual se puede realizar
aplicando el método de regresión, que predice el comportamiento de la variable dependiente a
partir de una línea recta, exponencial u otra formada por los datos de la variable independiente.
Se denomina regresión simple a la que emplea una sola variable independiente y regresión
múltiple a la que recurre a varias.

Los modelos causales relacionan muchas veces la demanda con el número de habitantes, con su
ingreso per cápita, con la participación de la mujer en el mercado laboral o con la cantidad de
empresas, entre otras variables. Por ejemplo, la demanda por lavavajillas está directamente
relacionada con los tres primeros factores mencionados. En las grandes ciudades, donde el poder
adquisitivo es mayor y un gran número de mujeres trabaja, las compras de lavavajillas son sin
duda mayores que en pueblos pequeños con escasos ingresos y donde pocas mujeres trabajan. Lo
mismo pasa con la demanda de líneas telefónicas, donde la existencia de factores como la
población, el número de empresas, el producto interno bruto (PIB), la actividad industrial o los
índices de construcción, entre otros, puede correlacionarse fácilmente con su demanda.

El método de los mínimos cuadrados o regresión lineal busca determinar la recta que represente
de mejor manera la tendencia de las relaciones observadas entre dos variables, para usarlas como
base de la proyección de la tendencia futura, calculando en la Ecuación 3.1 los valores de a y b que
definan la función Y que minimice las desviaciones, los datos observados y la ecuación.

Y = a + bx

Donde Y es la función de proyección o línea de tendencia; a, el comportamiento no explicado por


la variable x; b, el comportamiento explicado por la variable x que indica en cuánto cambia el valor
de Y por cada unidad que cambie x.

Existen diversas formas de calcular el valor de las variables a y b. A continuación, se explican los
procedimientos para hacer el cálculo mediante los más utilizados: el uso de fórmulas y el de los
facilitadores de Excel, a saber, Análisis de datos y el ajuste de la línea de tendencia al gráfico de
dispersión. En todos los métodos se usará la información base que se exhibe en la Tabla 3.1.

Datos recolectados de población infantil y demanda por comun

POBLACIÓN Ventas en
COMUNA
INFANTIL (X) unidades (y)

1 14680 3845
2 22930 5450
3 16650 5099
4 35990 8890
5 32480 6681
6 38770 9678
7 10030 4542
8 24260 4557
9 52460 13289
10 36800 10506
11 17340 5134
12 43690 9066

En la Tabla 3.1 se puede observar que, aunque exista una relación entre la cantidad de niños y las
ventas (a mayor población, mayores ventas), estas pueden tener comportamientos erráticos. Por
ejemplo, la comuna más pequeña tiene 10.030 niños y se venden 4.542 unidades, mientras que la
que le sigue en tamaño (la número 1), teniendo un 40% más de población, vende menos unidades.

Obviamente, una de las dos es menos representativa que la otra con respecto al comportamiento
entre demanda y población. La regresión reúne todos los datos históricos disponibles y estima el
mejor promedio entre todos ellos, separando la cantidad (a) de unidades vendidas que no son
explicadas por la población (accesos, lejanía de las viviendas a los centros de venta, etc.) de
aquellas (b) que sí son explicadas por ella.

a. Uso de fórmulas

El primer procedimiento para determinar la línea de tendencia recurre a las ecuaciones siguientes
para definir los valores de a y de b.

COMUN POBLACIÓN Ventas XY X²


A INFANTIL (X) en
unidades
(y)
1
14,680 3,845 56,444,600 215,502,400
2
22,930 5,450 124,968,500 525,784,900
3
16,650 5,099 84,898,350 277,222,500
4
35,990 8,890 319,951,100 1,295,280,100
5
32,480 6,681 216,998,880 1,054,950,400
6
38,770 9,678 375,216,060 1,503,112,900
7
10,030 4,542 45,556,260 100,600,900
8
24,260 4,557 110,552,820 588,547,600
9
52,460 13,289 697,140,940 2,752,051,600
10
36,800 10,506 386,620,800 1,354,240,000
11
17,340 5,134 89,023,560 300,675,600
12
43,690 9,066 396,093,540 1,908,816,100

346,080 86,737 2,903,465,410 11,876,785,000


∑XY
2,903,465,410
∑X
346,080
∑Y
86,737

28,840

7,228
∑X²
11,876,785,000
(∑X)²
119,771,366,400
Formula
b= (n)∑xy - (∑y)
(n)∑x² - (∑x)²

a= Ῡ - bẊ

Donde n es el número de observaciones; y, el valor promedio de la variable y, y x,


el valor promedio de la variable x.

b= 12*(2903465410)-(86737)*(346080)
= 4823643960
12*(11876785000)-119771366400= 22750053600

b= 0.212027806

a= 7228-(0.212027806*28840)
a= 1113.118075

Y = a + bx 1113.118075+0212027806X

Para pronosticar las ventas en una nueva comuna, se reemplaza x por la población
infantil.

b. Uso del comando Análisis de datos de Excel:

Con los datos del ejemplo anterior traspasados a una hoja Excel, se debe seguir el siguiente
procedimiento:

1. Seleccione Datos de la barra de opciones.

2. En Análisis, elija la opción Análisis de datos.

3. En el cuadro de diálogo que se abrirá, seleccione la opción Regresión y elija

Aceptar.

4. En el cuadro de diálogo Regresión, use el casillero Rango Y de entrada para anotar la posición de
los datos de la variable dependiente (Ventas).

5. Use el casillero de Rango X de entrada para especificar la posición de los datos de la variable
independiente (Población infantil).

6. Utilice las Opciones de salida para especificar el lugar donde quiere ubicar los resultados. Si elige
la opción En una hoja nueva, asígnele un nombre (Resultados regresión).

La Figura 3.1 muestra el resultado que debería obtenerse.


Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.93354229
Coeficiente de determinación R^2 0.87150121
R^2 ajustado 0.85865134
Error típico 1121.00855
Observaciones 12

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 85228887.3 85228887.3 67.8217468 9.1255E-06
Residuos 10 12566601.6 1256660.16
Total 11 97795488.9

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción 1113.2014 809.96669 1.37437923 0.19933934 -691.516854 2917.91965 -691.516854 2917.91965
Variable X 1 0.21202781 0.02574592 8.23539597 9.1255E-06 0.15466233 0.26939328 0.15466233 0.26939328

Como se puede observar, en las celdas B17 y B18 de la Figura 3.2 aparecen directamente los
valores de a y b, denominados como Intercepción y Variable X 1, respectivamente, datos que son
coincidentes con los obtenidos mediante el uso de las fórmulas.

En el Resumen de los resultados de la regresión aparecen tres conceptos bajo el título de Análisis
de varianza: Regresión, Residuos y Total. Los valores bajo la columna Suma de cuadrados se
interpretan como sigue.

Regresión: variación que se puede explicar por los datos del modelo (dispersión en los valores
estimados con respecto al promedio de los datos observados) y corresponde a la suma de los
cuadrados de las diferencias entre cada valor estimado por el modelo y el promedio de los datos
observados.

Residuos: suma de los cuadrados de las diferencias entre los datos observados y los determinados
por el modelo.

Total: dispersión de los datos que se calcula como la diferencia entre el promedio de los datos
observados y la suma de esos datos al cuadrado.

Si se relativizan los valores de Regresión y Residuos respecto de Total, se tiene:

Suma de %
cuadrados
Regresión 85228887.3
0.87150
Residuos 12566601.61
0.12850
Total 97795488.92
1.00

El valor relativo de Regresión (0,87150) es el mismo que en las Estadísticas de la regresión aparece
con el nombre de Coeficiente de determinación R^2 (celda B5), y corresponde al porcentaje de la
variación que puede ser explicado por el comportamiento de la variable independiente. Es decir,
mientras más cercano a 1 sea este valor, mejor se considera el ajuste determinado.

Si el coeficiente es positivo y elevado (muy cercano a 1), las variables x e y tienen


comportamientos altamente relacionados. Si el coeficiente muestra valores negativos, el
comportamiento de las variables es opuesto, es decir, mientras mayor sea el valor de x, menor
será el de y. Si el coeficiente es 0, no existe correlación entre las variables, y la ecuación obtenida
no sirve para estimar el valor de Y. Si el coeficiente es 1, no existe diferencia entre el valor
estimado y los datos observados.

El Error típico (que aparece en la celda B7) se calcula como la raíz cuadrada de los residuos y su
número de grados de libertad (n − 1):

Residuos ❑
= 85.228 .887 .3 = 1,121,0085
√ ¿ Grados de libertad √ 10

c. Ajuste de líneas de tendencia a un gráfico de dispersión

Este método aprovecha las posibilidades que proporciona Excel para ajustar una línea de
tendencia de una serie de datos en un gráfico de dispersión (XY) y para visualizar la función R2 que
define esta línea de tendencia.

Modelos de series de tiempo:

Los modelos de series de tiempo pronostican el valor futuro de la variable que se desea estimar,
extrapolando el comportamiento histórico de los valores observados para esa variable. Estos
modelos asumen que la variable que explica la demanda futura es el paso del tiempo. Las
fluctuaciones observadas en el pasado pueden diferenciarse en tres tipos: de tendencia, cíclica y
estacional, cuyo comportamiento puede graficarse como sigue.
Las curvas que más se utilizan para describir una serie histórica y que no son excluyentes para
predecir el comportamiento de la demanda a través del tiempo son la lineal (Y = a + bx), la
parabólica o polinómica (Y = a + bx + cx2) y la exponencial (Y = aebx).

La definición de un comportamiento histórico no es una proyección en sí misma. La extrapolación


de la información del pasado es solo un dato complementario que supone que las condiciones que
lo explicaron en el pasado se mantendrán a futuro. La comprensión de qué determinó la tendencia
pasada permite, con más facilidad, aplicar el criterio o el sentido común para introducir ajustes a
futuro o definir posibles escenarios.

Existen ocho principales modelos de series de tiempo, que se pueden tipificar entre sin
estacionalidad y con estacionalidad, y entre sin tendencia y con tendencia.

Sin estacionalidad y sin tendencia: promedio móvil simple y suavizamiento exponencial.

Con estacionalidad y sin tendencia: aditivo estacional y multiplicativo estacional.

Sin estacionalidad y con tendencia: promedio móvil doble y suavizamiento exponencialdoble.

Con estacionalidad y con tendencia: aditivo Holt-Winter’s y multiplicativo Holt-Winter’s.

También podría gustarte