Está en la página 1de 54

Pronósticos

La proyección es la base de la planeación corporativa a largo plazo. El


personal de producción y operaciones utiliza proyecciones para tomar
decisiones periódicas que involucran la selección de los procesos, la
planeación de la capacidad y la disposición de las instalaciones, al igual que
las continuas decisiones acerca de la planeación de la producción, su
programación y el inventario.

Una proyección perfecta es virtualmente imposible, ya que existen muchos


factores que no pueden predecirse con certeza, así que el objetivo deberá
ser utilizar el mejor método de proyección posible. Para llevar a cabo una
proyección exitosa se debe revisar y actualizar continuamente los datos.

La administración de la demanda, tiene el propósito de coordinar y controlar


todas las fuentes de demanda para que el sistema productivo sea eficiente y
el producto se despache a tiempo.
Fuentes

Existen dos fuentes básicas de demanda:

 Dependiente, es la demanda de un producto o servicio causada por la demanda


de otros productos o servicios, y no necesita proyección, sino un registro.

 Independiente, es la que no se deriva directamente de otros productos.

La empresa no puede influir en la dependiente, pero sí en la


independiente de la siguiente manera:

1. Realizar acciones para influir en la demanda.


2. Ser pasiva y sólo responder a la demanda.
Propósito

Las organizaciones a menudo usan los pronósticos con tres fines:

Para decidir si la demanda es suficiente para generar los rendimientos deseados. Si


no la organización debe rechazar la oportunidad.
Para determinar las necesidades de capacidad a largo plazo al diseñar las
instalaciones. Una proyección precisa de la demanda, puede ahorrarle a la
organización grandes gastos para ampliar o contraer la capacidad con el fin de
adaptarse a la demanda futura.
Para determinar las fluctuaciones a corto plazo (de 1 semana a 3 meses) de la
demanda del producto, programar la mano de obra, fijar la cantidad de materiales, etc.

Según la precisión que se requiera, se impondrán métodos desde simples hasta


altamente sofisticados. Los pronósticos a largo plazo (3 a 10 años) exigen
menos precisión y sirven únicamente para fines de planificación general,
mientras que los de corto plazo (una semana a varios meses) requieren gran
precisión, porque en ellos se basa la mano de obra detallada, la programación
de las máquinas y la planificación de materiales.
Tipos

Los tipos de proyección se clasifican en:

Cualitativas, son subjetivas y de juicio y se basan en


opiniones.

Análisis de las series de tiempo, en la que los datos de la


demanda anterior se pueden usar para predecir la
demanda futura.

Proyección causal, en la que se usa la técnica de


regresión, en la que la demanda está relacionada con
factores subyacentes del medio.
Técnicas cualitativas

Proyección fundamental

Esta técnica forma la proyección agregando niveles sucesivos desde


abajo. La base del este método es suponer que la persona más
cercana al cliente o la utilización final del producto, conoce mejor sus
necesidades futuras. Aunque esto no es siempre cierto, es una
suposición válida.

Las proyecciones efectuadas en este nivel de abajo se suman y se


pasan al nivel superior que sigue. Por ejemplo, una proyección de las
ventas generales puede derivarse combinando las informaciones de
cada vendedor, quién es el que está cerca de su propio territorio de
mercado.
Investigación de mercado
Las empresas contratan consultores en investigación de mercados
que recopilan datos por medio de encuestas, para buscar nuevas
ideas, gustos y preferencias de productos existentes, de la
competencia, etc. Esta investigación se utiliza para proyectar ventas
de largo alcance y de nuevos productos.

Consenso de grupo
Esta técnica se basa en la idea de que un grupo de personas de
varias posiciones puede desarrollar una proyección más confiable
que la de un grupo más pequeño. Se desarrollan a través de
reuniones abiertas con libre intercambio de ideas con todos los
niveles de gerencia, vendedores o clientes. La dificultad de la técnica
es que los niveles superiores pueden ejercer intimidación a los
niveles inferiores.
Analogía histórica
Se proyecta la demanda de un nuevo producto con un producto ya existente análogo: producto
complementario o competitivo. Un ejemplo sería el de una empresa que produce tostadoras,
podría usar su base de datos histórica de ventas para proyectar la demanda de cafeteras.

Método Delfi
Para evitar la dificultad de intimidación del consenso de grupo, este método oculta la identidad
de los participantes del estudio y además todas las opiniones tienen el mismo peso. El
procedimiento es:
1. Escoger a los expertos que van a participar. Debe haber variedad de conocimientos en áreas
diferentes.
2. A través de un cuestionario obtener las proyecciones de los participantes.
3. Resumir los resultados y redistribuirlos a los participantes junto con nuevas preguntas.
4. Resumir de nuevo, refinar las proyecciones y condiciones y desarrollar nuevas preguntas.
5. Repetir el paso 4 si es necesario. Distribuir los resultados finales a los participantes.
Se pueden lograr resultados satisfactorios en 3 vueltas, la idea es lograr un consenso en la
proyección.
Cálculo de pronósticos de series temporales
Errores en la proyección
𝑛 𝑛
𝑖=1 𝐷𝑒𝑚𝑎𝑛𝑑𝑎 𝑟𝑒𝑎𝑙 − 𝑑𝑒𝑚𝑎𝑛𝑑𝑎 𝑝𝑟𝑜𝑛𝑜𝑠𝑡𝑖𝑐𝑎𝑑𝑎 𝑖 𝑖=1 𝑒𝑖
𝑀𝐴𝐷 (𝑀𝐴𝐸) = =
𝑒𝑖 𝑛 𝑛
𝑛
𝑖=1 𝑌𝑖
𝑀𝐴𝑃𝐸 = ∗ 100
𝑛
𝑛 𝑛
𝑖=1 𝐷𝑒𝑚𝑎𝑛𝑑𝑎 𝑟𝑒𝑎𝑙 − 𝐷𝑒𝑚𝑎𝑛𝑑𝑎 𝑝𝑟𝑜𝑛𝑜𝑠𝑡𝑖𝑐𝑎𝑑𝑎 𝑖 𝑖=1 𝑒𝑖
𝑆𝑒𝑠𝑔𝑜 (𝑀𝐸) = =
𝑛 𝑛
𝑛 𝑒𝑖
𝑖=1 𝑌𝑖
𝑀𝑃𝐸 = ∗ 100
𝑛
𝑅𝑆𝐹𝐸
𝑇𝑆(𝑠𝑒ñ𝑎𝑙 𝑑𝑒 𝑟𝑎𝑠𝑡𝑟𝑒𝑜) =
𝑀𝐴𝐷
𝑛 2
𝑖=1 𝑒𝑖
𝑅𝑀𝑆𝐸 =
𝑛
RSFE es la suma continua de los errores de proyección,
considerando los signos.
Ejemplo

Proyecc Deman e abs Sesgo e^2


Mes e e acum e abs MAE TS MPE MAPE e^2 RMSE
ión da real acum (ME) acum

1 1000 950 -50 -50 50 50 50,00 -1,00 2500 50,00


-50,00 -5,2632 5,2632 2500
2 1000 1070 70 20 70 120 60,00 0,33 7400 60,83
10,00 0,9346 5,6075 4900
3 1000 1100 100 120 100 220 73,33 1,64 17400 76,16
40,00 3,6364 6,6667 10000
4 1000 960 -40 80 40 260 65,00 1,23 19000 68,92
20,00 2,0833 6,7708 1600
5 1000 1090 90 170 90 350 70,00 2,43 27100 73,62
34,00 3,1193 6,4220 8100
6 1000 1050 50 220 50 400 66,67 3,30 29600 70,24
36,67 3,4921 6,3492 2500
220 400
Totales 29600

La proyección en promedio estaba errada en 67 unidades (6,35%), la señal de rastreo


era de 3 desviaciones positivas y el sesgo era de 37 (3,49%), indicando que la
proyección subestimó la demanda real. El RMSE es de 70 unidades.
Métodos de pronóstico

Métodos sencillos
Dos métodos sencillos pero nada satisfactorios son: el promedio de toda la
demanda y la demanda del último periodo, para pronosticar la del periodo
siguiente.

Ejemplo:
Un centro de salud es una clínica sostenida con fondos federales, que atiende las
necesidades de los pobres del centro de la ciudad. Actualmente se encuentra en su
cuarto año de operaciones y está elaborando su plan de personal para el próximo
trimestre. El gobierno federal exige que, cada trimestre, el centro formule una solicitud
de presupuesto para el siguiente. La solicitud se basa en buena parte en el pronóstico
de la demanda de servicios específicos para el trimestre siguiente.

Anteriormente el director del centro de salud ha tratado de pronosticar la demanda,


pero ninguna de sus técnicas ha resultado satisfactoria.
Año Trimestre Número de Número de visitas de
periodo pacientes
1971 1 1 3500
2 2 8000
3 3 5500
4 4 10000
1972 1 5 4500
2 6 6000
3 7 3000
4 8 5500
1973 1 9 5000
2 10 9500
3 11 7500
4 12 15000
1974 1 13 13500
2 14 17500
 El empleo de la demanda anterior como pronosticador de la del siguiente
produjo pronósticos muy erráticos. Por ejemplo, el administrador produjo por
este método una demanda de 3500 visitas para el segundo trimestre de
1971, pero en realidad fueron 8000 (la horas extra y los pedidos hechos
apresuradamente llegaron al máximo durante este trimestre). Luego
pronosticó 8000 visitas para el tercer trimestre, pero únicamente se
atendieron 5500.

Luego recurrió al promedio de toda la demanda, para pronosticar la del


periodo siguiente. Para el cuarto trimestre de 1971 predijo una demanda de
5667 ((3500+8000+5500)/3), pero fue realmente de 10000.

Después de evaluar estos dos métodos sencillos, el administrador decidió


considerar métodos más sofisticados.
Promedios móviles
Para superar el problema que implica el uso de un simple promedio, esta técnica genera el
pronóstico del periodo siguiente promediando únicamente la demanda real de los últimos n períodos
(n es con frecuencia del orden de 4 o 7). La elección del valor de n es arbitraria, pero debe estar
basada en la experimentación; es decir debe ser aquel que mejor se adapte a los datos históricos
disponibles.

Este promedio móvil se calcula mediante la siguiente fórmula:

𝑡
𝑖=𝑡−𝑛+1 𝐷𝑖
𝐹𝑡+1 =
𝑛
En donde:

t = Número de periodo del periodo actual


Ft+1 = Pronóstico de la demanda para el periodo siguiente
Di = Demanda real en el periodo i
n = Número de periodos de demanda que se deben incluir (el orden)
Ejemplo

Volviendo al ejemplo del centro de salud, el administrador puede


pronosticar la demanda del tercer trimestre de 1974, usando un
promedio móvil de orden 4, de la siguiente manera:
14 14
𝑖=14−4+1 𝐷𝑖 𝑖=11 𝐷𝑖 (𝐷11 + 𝐷12 + 𝐷13 + 𝐷14 )
𝐹14+1 = = =
4 4 4
(7500 + 15000 + 13500 + 17500)
𝐹15 = = 13375
4

32250
El MAD tiene un valor de 𝑀𝐴𝐷 = = 3225, el sesgo es: 𝑆𝑒𝑠𝑔𝑜 =
10
18000 18000
= 1800 y el TS es: 𝑇𝑆 = = 5,58. Obviamente estos valores
10 3225
revelan que el pronóstico no es muy confiable. En general se ha
subestimado la demanda real.
Año Trimestre Número de Y real Y Residuos Residuos
periodo pronosticado absolutos
1971 1 1 3500 - - -
2 2 8000 - - -
3 3 5500 - - -
4 4 10000 - - -
1972 1 5 4500 6750 -2250 2250
2 6 6000 7000 -1000 1000
3 7 3000 6500 -3500 3500
4 8 5500 5875 -375 375
1973 1 9 5000 4750 250 250
2 10 9500 4875 4625 4625
3 11 7500 5750 1750 1750
4 12 15000 6875 8125 8125
1974 1 13 13500 9250 4250 4250
2 14 17500 11375 6125 6125
3 15 - 13375 18000 32250
20000
18000
16000
14000
12000
10000
8000
6000
4000
2000
0
0 5 10 15 20
Y real Y pronosticado

La media móvil es un término medio entre el pronóstico de la demanda


del período anterior y el promedio simple. Si se incluyen pocos periodos,
el pronóstico es similar al de la demanda del periodo anterior, y si se
incluyen muchos, es similar al promedio simple.
Igualación o ajuste exponencial
Este método se lleva a cabo con la siguiente ecuación:
𝑃𝑟𝑜𝑛ó𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑙𝑎 𝑛𝑢𝑒𝑣𝑎 𝑑𝑒𝑚𝑎𝑛𝑑𝑎 = 𝛼 𝐷𝑒𝑚𝑎𝑛𝑑𝑎 𝑎𝑐𝑡𝑢𝑎𝑙 + 1 − 𝛼 𝑃𝑟𝑜𝑛ó𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑒𝑚𝑎𝑛𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟

𝐹𝑡 = 𝛼 𝐷𝑡 + 1 − 𝛼 𝐹𝑡−1

𝛼 es una constante de igualación entre 0 y 1. Es el peso asignado a la última


demanda real. Mientras más cerca esté de 1, mayor será la influencia de la
demanda actual para el pronóstico y viceversa. Con el promedio móvil, en
cambio, a todas las demandas se le asigna un peso igual al determinar el
pronóstico del periodo siguiente.
La selección del valor adecuado de 𝛼 se hace de la siguiente manera:
 Valores altos de 𝛼 se usan cuando hay baja variabilidad en la serie cronológica
(presenta una curva bastante uniforme y viceversa).
 El valor adecuado de 𝛼, al igual que el de n, se determina por un proceso de
prueba y error. Una manera es probar distintos valores y elegir el que tenga menor
MAD.
Ejemplo
𝐹2 = 0,1 3500 + 0,9 3500 = 3500
𝐹3 = 0,1 8000 + 0,9 3500 = 3950
Número Y Y
Residuos Residuos
Año Trimestre de Y real pronosticado Residuos pronosticado Residuos
absolutos absolutos
periodo (a=0,1) (a=0,6)
1971 1 1 3500 3500 0 0 3500 0 0
2 2 8000 3500 4500 4500 3500 4500 4500
3 3 5500 3950 1550 1550 6200 -700 700
4 4 10000 4105 5895 5895 5780 4220 4220
1972 1 5 4500 4694,5 -194,5 194,5 8312 -3812 3812
2 6 6000 4675,05 1324,95 1324,95 6024,8 -24,8 24,8
3 7 3000 4807,545 -1807,545 1807,545 6009,92 -3009,92 3009,92
4 8 5500 4626,7905 873,2095 873,2095 4203,968 1296,032 1296,032
1973 1 9 5000 4714,11145 285,88855 285,88855 4981,5872 18,4128 18,4128
2 10 9500 4742,70031 4757,2997 4757,2997 4992,63488 4507,36512 4507,36512
3 11 7500 5218,43027 2281,56973 2281,56973 7697,05395 -197,053952 197,053952
4 12 15000 5446,58725 9553,41275 9553,41275 7578,82158 7421,178419 7421,17842
1974 1 13 13500 6401,92852 7098,07148 7098,07148 12031,5286 1468,471368 1468,47137
2 14 17500 7111,73567 10388,2643 10388,2643 12912,6115 4587,388547 4587,38855
3 15 - 8150,5621 15665,0446
46505,621 50509,711 20275,0743 35762,6222

El MAD para 𝛼 de 0,1 es de 3885,4, el sesgo es de 3577,3 y el TS es de 11,97. Para


un 𝛼 de 0,6 el MAD es de 2751, el sesgo de 1559,6 y el TS de 7,37.
20000

15000

10000

5000

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Y real Y pronosticado (a=0.1) Y pronosticado (a=0.6)

Se puede observar que un mejor pronóstico se logra con un 𝛼 de 0,6, pero aun así el
pronóstico ha subestimado la demanda real. De los resultados se deduce que se debería
haber usado un 𝛼 más cercano a 1.
Series temporales
Los valores en el tiempo son resultado de un conjunto de fuerzas o factores
que actúan sobre el fenómeno en estudio. Estas fuerzas pueden ser
agrupadas en cuatro grandes componentes:
Componente Definición Razón de la influencia Duración
(Clasificación)
T Patrón de movimiento global o Cambios en tecnología, población, Varios años
(Sistemático) persistente, a largo plazo. riqueza, valores.
E Fluctuación más o menos Condiciones de clima, costumbres Dentro de 12 meses (O
(Sistemático) regular que ocurre en cada sociales o religiosas. datos mensuales o
periodo de 12 meses cada año. trimestrales).

C Oscilación o movimiento Interacción de numerosas De 2 a 10 años, con


(Sistemático) repetitivo arriba o abajo en 4 combinaciones de factores que diferente intensidad en
etapas: Pico (prosperidad), influyen en la economía. un ciclo completo.
contracción (recesión), fondo
(depresión) y expansión
(recuperación o crecimiento)
A Fluctuación errática o residual Variaciones aleatorias en los datos o Corta duración y sin
(No sistemático) presente después de tomar en debidas a eventos no previstos como repetición.
cuenta los efectos sistemáticos. huelgas, huracanes, inundaciones,
asesinatos políticos, etc.
Hipótesis multiplicativa: 𝑦=𝑇𝑥𝐸𝑥𝐶𝑥𝐴
Hipótesis aditiva: 𝑦=𝑇+ 𝐸+ 𝐶+ 𝐴
Descomposición. Tendencia lineal, modelo multiplicativo
Conceptualmente el modelo se presenta así:

𝑃𝑟𝑜𝑛ó𝑠𝑡𝑖𝑐𝑜 = 𝑇𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 𝑇 𝑥 𝑐𝑜𝑚𝑝𝑜𝑛𝑒𝑛𝑡𝑒 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑙 (𝐸)

Para desarrollar este modelo se debe analizar primero los datos históricos disponibles y
tratar de descomponer los datos originales en sus dos componentes, T y E.

La tendencia: Como ya se explicó, la tendencia es la dirección que toma a la larga la serie


de datos.
La estacionalidad: Reconociendo que hay un claro patrón de temporada se puede estimar
la magnitud de la variación por temporada respecto a la curva de tendencia (el
componente de estacionalidad).
Los pasos para el cálculo son los siguientes:

1. Se calcula la tendencia secular de la serie (𝑦 = 𝑇𝐶) por el método de medias móviles, tomando como periodo el
número de periodos en los que se divide un año. En este caso, como el año se dividió en trimestres, el n es de 4.
Luego se centran los valores con un n de 2.

2. Se elimina de la serie la tendencia secular, dividiendo los valores originales de la serie entre la tendencia secular
𝑇𝐸𝐶𝐴
hallada en el paso 1 𝑦 = 𝑇𝐸 = .
𝑇𝐶

3. Se elimina la variación accidental (A) de la serie, hallando el promedio de los valores de cada trimestre del año,
para obtener la variación estacional de la serie (𝑦 = 𝐸), también denominado índice de variación estacional
(IVE).

𝑇𝐸𝐶𝐴
4. Se desestacionaliza la serie, dividiendo los valores originales entre el IVE 𝑌 = = 𝑇𝐶𝐴 .
𝐸

5. Se determina un modelo lineal de los valores desestacionalizados de la serie, mediante el método de mínimos
cuadrados (𝑌𝑒 ).

6. Se ajusta el valor estimado de la serie desestacionalizada multiplicando cada valor de Ye por el IVE. Por último
se halla el pronóstico requerido.
Ejemplo

Se presenta el volumen trimestral de pasajeros del nuevo Tráfico Masivo del Centro de la
ciudad (en miles). Se ve que la demanda aumenta de modo general. Para pronosticar el
futuro volumen de pasajeros, el alcalde de la ciudad ha decidió probar el modelo por
tiempos de tendencia lineal, basado en la suposición de que la demanda sigue a la vez
una tendencia bastante constante de un trimestre a otro y patrón trimestral de temporada
(estacionalidad).
Trimestre Pasajeros (miles)
(xi) (yi)
1 3,5
2 8
3 5,5
4 10
5 9,5
6 14
7 11,5
8 16
9 15,5
10 20
11 17,5
12 22
13 21,5
14 26
105 200,5
30
25
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Observando el gráfico por tiempos de los datos de la demanda, resulta claro que la
demanda está por arriba del promedio durante el segundo y cuarto trimestres, y
abajo del promedio en el primero y el tercero, debido probablemente al clima.
Ye
Pasajeros y=TC y=TC
Trimestre Periodo y=EA y=IVE Y=TCA Ye ajustado
(miles) (yi) (n=4) (n=2)
por IVE
1 1 3,5 0,922 3,796 4,523 4,170

2 2 8 6,75 1,139 7,024 6,028 6,865


3 3 5,5 8,25 7,5 0,733 0,828 6,646 7,533 6,233
4 4 10 9,75 9 1,111 1,075 9,301 9,037 9,716
1 5 9,5 11,25 10,5 0,905 0,922 10,303 10,542 9,721
2 6 14 12,75 12 1,167 1,139 12,293 12,047 13,720
3 7 11,5 14,25 13,5 0,852 0,828 13,897 13,552 11,215
4 8 16 15,75 15 1,067 1,075 14,882 15,057 16,188
1 9 15,5 17,25 16,5 0,939 0,922 16,810 16,562 15,271
2 10 20 18,75 18 1,111 1,139 17,561 18,067 20,576
3 11 17,5 20,25 19,5 0,897 0,828 21,147 19,572 16,196
4 12 22 21,75 21 1,048 1,075 20,463 21,077 22,660
1 13 21,5 0,922 23,317 22,582 20,822

2 14 26 1,139 22,829 24,086 27,432

3 15 0,828 25,591 21,178

4 16 1,075 27,096 29,132


30,000 Y=TCA

25,000

y = 1,5049x + 3,0178
20,000
R² = 0,9848

15,000

10,000

5,000

0,000
0 2 4 6 8 10 12 14 16
Proyección causal
En muchas investigaciones el objetivo es determinar a partir de información histórica, funciones
mediante las cuales se puedan realizar pronósticos, lo más exactamente posible, entre dos o más
variables relacionadas entre sí. Los análisis de regresión y correlación brindan al investigador las
herramientas necesarias para cumplir este objetivo.

Para que sea valiosa desde el punto de vista de la proyección, cualquier variable independiente
debe ser un indicador anticipado. Por ejemplo, se puede esperar que un periodo extenso de lluvias
incremente la venta de paraguas e impermeables. Esto es una relación causal, en la cual una
ocurrencia causa la otra. Si el elemento causante se puede prever con anticipación, puede
utilizarse como base de la proyección.

El primer paso en la proyección de la relación causal es encontrar las ocurrencias que constituyen
realmente las causas. Pueden ocurrir varios escenarios al tratar de encontrar las causas:

 Algunos indicadores anticipados no son relaciones causales pero, de manera indirecta, pueden sugerir la
ocurrencia de algunas otras causas.
 Otras relaciones causales pueden existir solo como coincidencia. Ej: Las ventas de alcohol en Suecia era
directamente proporcional a los salarios de los profesores. Esta es una relación falsa o también denominada
espuria.
Regresión y correlación

Lineal
Simple
Potencial
Regresión
Exponencial
No Lineal
Múltiple
Logarítmica
Tipo de
Análisis Polinomial

Coeficiente de correlación

Correlación Coeficiente de determinación

Coeficiente de no determinación
Regresión y Correlación
Regresión.
 Análisis de regresión. Técnica empleada para desarrollar
una ecuación que permite expresar la relación entre
variables, y estimar el valor de y, con base en valores para
xi.
 Diagrama de dispersión: Es una gráfica que presenta la
relación entre dos variables de interés.
 Principio de mínimos cuadrados: Técnica empleada para
llegar a la ecuación de regresión minimizando la suma de
los cuadrados de las distancias verticales entre los valores
Y observados y los valores pronosticados de Y:
Min: Z   ( Y  Y' ) 2
Diagrama de Dispersión
Tipos de regresión


y 

 
 
 


x
Dependencia
y  a  bxlineal
inversa
Tipos de regresión múltiple
Correlación
 Coeficiente de correlación: Mide la intensidad de la relación
entre dos conjuntos de variables:
S 2ye S 2ye
r 2  1 2
S y S y
Varianza total: Varianza explicada: Varianza no explicada:
Sy 
2  ( yi  y ) 2

S 2ye 
 (y e  y)
2

S 2ye 
 (y i  y e ) 2

n n n

 Esquema de la intensidad y dirección del coeficiente:

Negativa Ninguna Positiva


perfecta correlación Perfecta
intensa moderada débil débil moderada intensa

-1 -0.5 0 0.5 1
 Se cumple que:

S  S S
2
y
2
ye
2
ye
 Coeficiente de determinación: Mide la proporción de la
variación total en la variable dependiente, que se explica o
se debe a la variación en la variable independiente.
Varianza exp licada
r 
2
Varianza total

 Coeficiente de no determinación: Es la proporción de la


variación total en “y” que no es explicada por la variación
de “x”.
1 r 2
Regresión y Correlación Lineal
Ejemplo:
 Sea y = Consumo (decenas de bs.)
 Sea x = Ingreso (decenas de bs.)
xi yi
15 18
20 21
25 24
32 27
38 35
 Hallar la función de regresión y determinar su correlación.
 ¿Cuanto se gastaría si el ingreso es de 42, 50 y 87 bs?
Resolución
Primer paso: Diagrama de Segundo paso: Mínimos
dispersión: cuadrados:
Min: Z   ( Y  a  bx) 2
40
35 Minimizando la función
Consumo

30 anterior se llega a las


25 siguientes ecuaciones:
20 n xy   x y
b
n x 2  (  x ) 2
15
15 20 25 32 38
Ingreso
a  y  b x
 y  bx
La nube de puntos sugiere n
una línea recta de la forma: n  xy   x  y
r
y  abx  n x 2   x 2   n y 2   y 2 
       
Tercer paso: Calculo de los coeficientes “a” y “b”.
xi yi xiyi x2i ye (yi-y)2 (ye-y)2
15 18 270 225 17 49 64
20 21 420 400 21 16 16
25 24 600 625 24 1 1
32 27 864 1024 29 4 16
38 35 1330 1444 33 100 64
130 125 3484 3718 170 161

5( 3484 )  130(125 ) 125  0.69(130 )


b  0.69 a 7
5( 3718 )  (130 ) 2
5
y  7  0.69 x
Cuarto paso: Realizar el pronóstico.
y  7  0.69( 42)  36
y  7  0.69( 50 )  42
y  7  0.69( 87)  67
Quinto paso: Calcular el r y r2.

S 2

 (y i  y ) 2


170
 34 S 2

 (y e  y)2

161
 32.2
y ye
n 5 n 5

S 2

 ( yi  ye ) 2 9
  1.8 r
S 2ye

32.2
 0.97
ye 2
n 5 S y 34
r 2  0.95
Regresión y Correlación Múltiple
Ejemplo.
 x1 = Edad de los ejecutivos de una compañía
 x2 = No. de años que estuvieron en la Universidad
 y = Ingresos anuales (miles de $).
x1 x2 y
37 4 51.2
45 0 46.8
38 5 55.0
42 2 50.3
31 4 45.4

 Ajustar los datos a una ecuación polinomial.


 Estimar cuánto ganará en promedio un ejecutivo si tiene 40
años de edad y estuvo 4 años en la Universidad.
Ecuaciones para la regresión múltiple.
Los datos del ejemplo se ajustarán a una ecuación de
este tipo:
y  a  b x1  c x 2

Según mínimos cuadrados, se tendrá que minimizar:


Min: Z   ( Y  a  bx1  cx 2 ) 2
Las ecuaciones que resultan son:
na  b  x1  c x 2   y  0


 a  x 1  b  x 1  c  x 1x 2   x 1 y  0
2


  2
   1 2  2   x2y  0
 2
a x b x x c x
Resolución:

X1 x2 y x12 x1*x2 x1*y x22 x2*y ye  (yi-y)2  (ye-y)2

37 4 51.2 1369 148 1894.4 16 204.8 51.18 2.13 2.06

45 0 46.8 2025 0 2106.0 0 0 46.96 8.64 7.72

38 5 55.0 1444 190 2090.0 25 275.0 55.11 27.67 28.87

42 2 50.3 1764 84 2112.6 4 100.6 50.03 0.31 0.08

31 4 45.4 961 124 1407.4 16 181.6 45.41 18.83 18.73

193 15 248.7 7563 546 9610.4 61 762 57.59 57.48


El sistema de ecuaciones es:
5 a  193 b  15 c  248.7 a = 3.7213
193 a  7563 b  546 c  9610 .4 b = 0.9609
15 a  546 b  61 c  762 c = 2.9756
S 2y  11.5184 r  0.9990

S 2ye  11.4954 r 2  0.9980


La ecuación de regresión múltiple es:
y  3.7213  0.9609 x1  2.9756 x 2

El ejecutivo ganará 54060 $us anuales.


Regresión y Correlación No Lineal

Función exponencial. y  a * bx
Aplicando logaritmos: ln y  ln a  ln b x
Las ecuaciones son:
 ln y  n * ln a  ln b *  x



  x * ln y  ln a *  x  ln b *  x 2

Función potencial. y  a * xb
Aplicando logaritmos: ln y  ln a  b ln x
Las ecuaciones son:
 ln y  n *lna  b *  ln x



     2
ln y *ln x ln a * ln x b * (ln x )
Ejemplo: Regresión No lineal
Las cifras siguientes son datos sobre el porcentaje de las llantas radiales
producidas por cierto fabricante que aun pueden usarse después de
recorrer cierto número de millas:
Millas Porcentaje
recorridas útil
(miles)
1 98.2
2 91.7
5 81.3
10 64.0
20 36.4
30 32.6
40 17.1
50 11.3

Ajustar a una curva exponencial y estimar qué porcentaje útil tendrán las
llantas radiales del fabricante si recorrieron 25000 millas.
Resolución:
X y ln y x2 x*ln y ye  (yi-y)2  (ye-y)2

1 98 4.587 1 4.59 96.02 1947.02 1759.70

2 92 4.519 4 9.04 91.95 1415.64 1434.20

5 81 4.398 25 22.00 80.72 741.20 710.01

10 64 4.159 100 41.60 64.97 98.50 118.81

20 36 3.595 400 71.90 42.10 312.41 143.45

30 33 3.484 900 105.00 27.28 461.18 718.20

40 17 2.839 1600 114.00 17.67 1367.15 1325.20

50 11 2.425 2500 121.00 11.45 1829.70 1816.90

158 433 30.005 5530 488.00 8172.80 8026.40


Las ecuaciones resultantes son:
8 A  158 B  30.005 A  4.608 a  100.28
158 A  5530 B  488 B  0.043 b  0.9575

S 2y  1021.6 r  0.9910

S 2ye  1003.3 r 2  0.9821

La ecuación resultante es:


y  100.28 ( 0.9575) x

El porcentaje útil será 33.86%


Regresión y correlación no lineal múltiple

Dependiendo de la situación, los modelos son muy variados. Aquí


presentamos un ejemplo de modelación por medio de la función de
producción de Cobb-Douglas.

La producción Q en una fábrica, con frecuencia se considera como una


función de la cantidad K de la inversión de capital y del tamaño L de la
fuerza laboral.

Las funciones de producción de la forma:

𝑄 𝐾, 𝐿 = 𝐴 𝐾 𝛼 𝐿1−𝛼

donde A y 𝛼 son constantes positivas y 0 < 𝛼 < 1, han demostrado ser


especialmente útiles en el análisis económico.
Ejemplo

Un investigador quiere averiguar si los datos de producción de una compañía


pueden ser modelados mediante una función de Cobb-Douglas (rendimientos
constantes a escala). Para ello recopiló datos históricos mostrados en la tabla
que relaciona la cantidad invertida (K en miles de dólares), el tamaño de la
fuerza laboral (L en miles de horas-Hombre) y la producción (Q en miles de
unidades al año).

K L Q
10 10 900
15 10 1220
20 20 1800
25 20 2128
Mediante el método de mínimos cuadrados, se hallan las ecuaciones para determinar los
parámetros de la ecuación de Cobb-Douglas:

𝑄 𝐾, 𝐿 = 𝐴𝐾 𝛼 𝐿𝛽 donde 𝛼 + 𝛽 = 1

Aplicando logaritmos a la ecuación de Cobb-Douglas:


ln 𝑄 = ln( 𝐴𝐾 𝛼 𝐿𝛽 ) ln 𝑄 = ln 𝐴 + 𝛼 ln 𝐾 + 𝛽 ln 𝐿
Realizando un cambio de variables:
𝑞 = 𝑎 + 𝛼𝑘 + 𝛽𝑙
2
Minimizando: 𝑆 = 𝑞𝑖 − 𝑞𝑒
2
𝑆= 𝑞 − 𝑎 − 𝛼𝑘 − 𝛽𝑙

𝜕𝑆
=2 𝑞 − 𝑎 − 𝛼𝑘 − 𝛽𝑙 −1 = 0
𝜕𝑎
𝜕𝑆
=2 𝑞 − 𝑎 − 𝛼𝑘 − 𝛽𝑙 −𝑘 = 0
𝜕𝛼
𝜕𝑆
=2 𝑞 − 𝑎 − 𝛼𝑘 − 𝛽𝑙 −𝑙 = 0
𝜕𝛽
Repartiendo la sumatoria y multiplicando:
𝑞 = 𝑛𝑎 + 𝛼 𝑘+𝛽 𝑙

𝑞𝑘 = 𝑎 𝑘+𝛼 𝑘2 + 𝛽 𝑙𝑘

𝑞𝑙 = 𝑎 𝑙+𝛼 𝑘𝑙 + 𝛽 𝑙2

Volviendo al cambio de variable:


ln 𝑄 = 𝑛 ln 𝐴 + 𝛼 ln 𝐾 + 𝛽 ln 𝐿

ln 𝑄 ln 𝐾 = 𝑎 ln 𝐾 + 𝛼 ln 𝐾 2 +𝛽 ln 𝐿 ln 𝐾

ln 𝑄 ln 𝐿 = 𝑎 ln 𝐿 + 𝛼 ln 𝐾 ln 𝐿 + 𝛽 ln 𝐿 2
K L Q lnK lnL lnQ LnK LnL (LnK)2 (LnL)2 Ln K LnQ Ln L LnQ

10 10 900 2,3026 2,3026 6,8024 5,3019 5,3019 5,3019 15,6631 15,6631

15 10 1220 2,7081 2,3026 7,1066 6,2355 7,3335 5,3019 19,2450 16,3636

20 20 1800 2,9957 2,9957 7,4955 8,9744 8,9744 8,9744 22,4546 22,4546

25 20 2128 3,2189 2,9957 7,6629 9,6429 10,3612 8,9744 24,6660 22,9561

70 60 6048 11,2252 10,5966 29,0675 30,1547 31,9710 28,5526 82,0288 77,4374

Sustituyendo en las ecuaciones y resolviendo, se hallan los siguientes parámetros


de regresión:
ln 𝐴 = 4,5 𝐴 = 90 𝛼 = 0,75 𝛽 = 0,25
La ecuación de Cobb-Douglas será:
𝑄 𝐾, 𝐿 = 90 𝐾 3/4 𝐿1/4
Luego se realiza el análisis de correlación:
2 2
Qe 𝑄𝑖 − 𝑄 𝑄𝑒 − 𝑄
900,0045 374544 374538,4874
1219,9939 85264 85267,5654
1799,9836 82944 82934,5727
2128,0193 379456 379479,8395
922208 922220,4650

Entonces:
922220,4650
𝑟= =1
922208

Interpretación: Existe una relación perfecta entre la producción, la


inversión y el tamaño de la fuerza laboral.

𝑟 2 = 100% 1 − 𝑟 2 = 0%

También podría gustarte