Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dos grupos se identifican en esta categoría: los modelos causales y los modelos de series de
tiempo. Un tercero, el de datos de panel, es solo una combinación de los dos anteriores. Por
ejemplo, en un proyecto de atenciones pediátricas, un modelo causal vincularía el número de
prestaciones médicas con la cantidad de niños de cada zona geográfica; uno de series de tiempo
analizaría la evolución en el tiempo del número de prestaciones; y uno de datos de panel
relacionaría la evolución de la población infantil con el número de atenciones pediátricas a través
del tiempo.
Modelos causales:
Los modelos causales requieren que exista una relación entre los valores de ambas variables y que
los de la variable independiente sean conocidos o que su estimación otorgue una mayor confianza.
La forma más común de hacer proyección causal es el ajuste de curvas, el cual se puede realizar
aplicando el método de regresión, que predice el comportamiento de la variable dependiente a
partir de una línea recta, exponencial u otra formada por los datos de la variable independiente.
Se denomina regresión simple a la que emplea una sola variable independiente y regresión
múltiple a la que recurre a varias.
Los modelos causales relacionan muchas veces la demanda con el número de habitantes, con su
ingreso per cápita, con la participación de la mujer en el mercado laboral o con la cantidad de
empresas, entre otras variables. Por ejemplo, la demanda por lavavajillas está directamente
relacionada con los tres primeros factores mencionados. En las grandes ciudades, donde el poder
adquisitivo es mayor y un gran número de mujeres trabaja, las compras de lavavajillas son sin
duda mayores que en pueblos pequeños con escasos ingresos y donde pocas mujeres trabajan. Lo
mismo pasa con la demanda de líneas telefónicas, donde la existencia de factores como la
población, el número de empresas, el producto interno bruto (PIB), la actividad industrial o los
índices de construcción, entre otros, puede correlacionarse fácilmente con su demanda.
El método de los mínimos cuadrados o regresión lineal busca determinar la recta que represente
de mejor manera la tendencia de las relaciones observadas entre dos variables, para usarlas como
base de la proyección de la tendencia futura, calculando en la Ecuación 3.1 los valores de a y b que
definan la función Y que minimice las desviaciones, los datos observados y la ecuación.
Y = a + bx
Existen diversas formas de calcular el valor de las variables a y b. A continuación, se explican los
procedimientos para hacer el cálculo mediante los más utilizados: el uso de fórmulas y el de los
facilitadores de Excel, a saber, Análisis de datos y el ajuste de la línea de tendencia al gráfico de
dispersión. En todos los métodos se usará la información base que se exhibe en la Tabla 3.1.
POBLACIÓN Ventas en
COMUNA
INFANTIL (X) unidades (y)
1 14680 3845
2 22930 5450
3 16650 5099
4 35990 8890
5 32480 6681
6 38770 9678
7 10030 4542
8 24260 4557
9 52460 13289
10 36800 10506
11 17340 5134
12 43690 9066
En la Tabla 3.1 se puede observar que, aunque exista una relación entre la cantidad de niños y las
ventas (a mayor población, mayores ventas), estas pueden tener comportamientos erráticos. Por
ejemplo, la comuna más pequeña tiene 10.030 niños y se venden 4.542 unidades, mientras que la
que le sigue en tamaño (la número 1), teniendo un 40% más de población, vende menos unidades.
Obviamente, una de las dos es menos representativa que la otra con respecto al comportamiento
entre demanda y población. La regresión reúne todos los datos históricos disponibles y estima el
mejor promedio entre todos ellos, separando la cantidad (a) de unidades vendidas que no son
explicadas por la población (accesos, lejanía de las viviendas a los centros de venta, etc.) de
aquellas (b) que sí son explicadas por ella.
a. Uso de fórmulas
El primer procedimiento para determinar la línea de tendencia recurre a las ecuaciones siguientes
para definir los valores de a y de b.
a= Ῡ - bẊ
b= 12*(2903465410)-(86737)*(346080)
= 4823643960
12*(11876785000)-119771366400= 22750053600
b= 0.212027806
a= 7228-(0.212027806*28840)
a= 1113.118075
Y = a + bx 1113.118075+0212027806X
Para pronosticar las ventas en una nueva comuna, se reemplaza x por la población
infantil.
Con los datos del ejemplo anterior traspasados a una hoja Excel, se debe seguir el siguiente
procedimiento:
Aceptar.
4. En el cuadro de diálogo Regresión, use el casillero Rango Y de entrada para anotar la posición de
los datos de la variable dependiente (Ventas).
5. Use el casillero de Rango X de entrada para especificar la posición de los datos de la variable
independiente (Población infantil).
6. Utilice las Opciones de salida para especificar el lugar donde quiere ubicar los resultados. Si elige
la opción En una hoja nueva, asígnele un nombre (Resultados regresión).
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.93354229
Coeficiente de determinación R^2 0.87150121
R^2 ajustado 0.85865134
Error típico 1121.00855
Observaciones 12
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 85228887.3 85228887.3 67.8217468 9.1255E-06
Residuos 10 12566601.6 1256660.16
Total 11 97795488.9
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción 1113.2014 809.96669 1.37437923 0.19933934 -691.516854 2917.91965 -691.516854 2917.91965
Variable X 1 0.21202781 0.02574592 8.23539597 9.1255E-06 0.15466233 0.26939328 0.15466233 0.26939328
Como se puede observar, en las celdas B17 y B18 de la Figura 3.2 aparecen directamente los
valores de a y b, denominados como Intercepción y Variable X 1, respectivamente, datos que son
coincidentes con los obtenidos mediante el uso de las fórmulas.
En el Resumen de los resultados de la regresión aparecen tres conceptos bajo el título de Análisis
de varianza: Regresión, Residuos y Total. Los valores bajo la columna Suma de cuadrados se
interpretan como sigue.
Regresión: variación que se puede explicar por los datos del modelo (dispersión en los valores
estimados con respecto al promedio de los datos observados) y corresponde a la suma de los
cuadrados de las diferencias entre cada valor estimado por el modelo y el promedio de los datos
observados.
Residuos: suma de los cuadrados de las diferencias entre los datos observados y los determinados
por el modelo.
Total: dispersión de los datos que se calcula como la diferencia entre el promedio de los datos
observados y la suma de esos datos al cuadrado.
Suma de %
cuadrados
Regresión 85228887.3
0.87150
Residuos 12566601.61
0.12850
Total 97795488.92
1.00
El valor relativo de Regresión (0,87150) es el mismo que en las Estadísticas de la regresión aparece
con el nombre de Coeficiente de determinación R^2 (celda B5), y corresponde al porcentaje de la
variación que puede ser explicado por el comportamiento de la variable independiente. Es decir,
mientras más cercano a 1 sea este valor, mejor se considera el ajuste determinado.
El Error típico (que aparece en la celda B7) se calcula como la raíz cuadrada de los residuos y su
número de grados de libertad (n − 1):
Residuos ❑
= 85.228 .887 .3 = 1,121,0085
√ ¿ Grados de libertad √ 10
Este método aprovecha las posibilidades que proporciona Excel para ajustar una línea de
tendencia de una serie de datos en un gráfico de dispersión (XY) y para visualizar la función R2 que
define esta línea de tendencia.
Los modelos de series de tiempo pronostican el valor futuro de la variable que se desea estimar,
extrapolando el comportamiento histórico de los valores observados para esa variable. Estos
modelos asumen que la variable que explica la demanda futura es el paso del tiempo. Las
fluctuaciones observadas en el pasado pueden diferenciarse en tres tipos: de tendencia, cíclica y
estacional, cuyo comportamiento puede graficarse como sigue.
Las curvas que más se utilizan para describir una serie histórica y que no son excluyentes para
predecir el comportamiento de la demanda a través del tiempo son la lineal (Y = a + bx), la
parabólica o polinómica (Y = a + bx + cx2) y la exponencial (Y = aebx).
Existen ocho principales modelos de series de tiempo, que se pueden tipificar entre sin
estacionalidad y con estacionalidad, y entre sin tendencia y con tendencia.