Está en la página 1de 35

Modelos de regresión

con ejemplos prácticos


Sesión 4

PROFESOR:
Tomás Gálvez Martínez
Contenido
Modelos de regresión y pruebas estadísticas

• Introducción.
• El modelo de Análisis de Regresión (AR).
• Estructura y formulación del cálculo.
• Métodos y pasos para la selección de variables en Excel
y NCSS.

1. Caso práctico de BD Bebidas 1 en Excel.


La señal y el ruido – Nate Silver

Born Nathaniel Read Silver


January 13, 1978
East Lansing, Michigan
Residence Manhattan, New York City
Nationality USA
Education A.B., Economics (2000)
Alma mater University of Chicago
Occupation Statistician, journalist
Employer ESPN

“El mejor modo de acelerar el proceso de aprendizaje es


comprometernos a ponernos a prueba a nosotros mismos,
observando si nuestros pronósticos funcionan en el mundo
real en lugar de la comodidad que proporciona un modelo
estadístico. (“La señal y el ruido”, Nate Silver).
https://fivethirtyeight.com/contributors/nate-silver/

3
Introducción
¿Cuál es la más apropiada?

Estable

•Census X-11
• Box-Jenkins • Regresión Simple
• Regresión Múltiple
• Winters

Incompleta Completa
• Promedios
Móviles Simples
• Comité • Regresión Robusta
• Juicio Independiente

• Información Fuerza Fuente:


Institute of Business Forecasting (IBF)
de Ventas Junio 25,1999 Orlando,Fl
Inestable Copyrigth 1997
Charles W. Chase Jr.

4
Introducción

¿Qué método utilizar para pronosticar durante el Ciclo de Vida?

Pronosticar con: Pronosticar con:


Métodos Holt, Modelos
Cualitativos, econométricos,
Experimentos de Box & Jenkins
mercado Pronosticar Pronosticar con:
con: Holt, Winters y
Holt, Winters y Modelos de
Modelos de regresión
regresión

5
El modelo de Regresión

¿Qué son los modelos de regresión?


Modelos Causales:

• Modelos de regresión. Técnica estadística para encontrar la mejor relación


entre la variable dependiente y las variables independientes seleccionadas.
a. Simple, de una sola variable independiente
b. Múltiple, de más de dos variables independientes

Variable
Dependiente
Y = a + b1X 1+ b2X2 + ... + bkX k
Coeficientes o
razón de cambio Variables
de la variable Independientes

6
El modelo de Regresión

¿Qué son los modelos de regresión?

Recomendaciones generales (y necesarias) para el empleo de los modelos de


regresión

Conocimiento del producto, del mercado,


competencia, etc.
Graficar y definir relaciones esperadas

Obtener la matriz de correlación


Realizar pruebas estadísticas suficientes

7
El modelo de Regresión

¿Qué son los modelos de regresión?


Fases del estudio del modelo de regresión
1. Definir las variables que se utilizarán en el modelo de estimación
de la demanda
2. Preparación de datos
a. Recopilar antecedentes de los datos a utilizar
b. Evaluar y limpiar la información
c. Transformar datos
3. Análisis econométrico
a. Especificar modelo (lineal, exponencial, cuadrático, logarítmico, etc.)
b. Seleccionar y aplicar pruebas iniciales
c. Realizar el análisis econométrico
d. Realizar pruebas estadísticas
e. Corregir especificaciones y realizar de nuevo el modelo
4. Especificación de políticas y estructuras
8
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 1

9
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 2

10
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3

➢ Información utilizada para el análisis:


• 3 años de información histórica.
• Consumo en sacos de azúcar de los 9 segmentos a
nivel industrial (Dulces, Embotellador, Empacador,
Farmacéutico, Jugos, Lácteos, Panificador, Vinícola
y Otras Industrias) .
• En cada segmento se pronosticó la demanda con
base a la calidad de azúcar (Refino, Estándar, y
Superior)

➢ Objetivos:
• Describir las posibles variables que afectan la
demanda de azúcar en el país.
• Encontrar una correlación entre las variables que
afectan la demanda de azúcar y el consumo
histórico.
• Obtener la mejor ecuación de estimación de la
demanda.

11
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3

Descripción de variables
Variables internas
• Precio Venta
– Precio al que nuestro Cliente Industrial nos compra el saco de azúcar.
– Unidad de Medida: Q/saco

Variables Externas
• Precio México
– Precio Promedio de Mayoreo en México.
– Importante debido a que el diferencial de precio entre Guatemala y México genera movimiento
entre ambos países.
– Se obtiene de la página de la Secretaria de Economía de México
– Unidad de medida: $/qq
• Precio Mundial (#11)
– Precio Promedio al que se cotiza el Azúcar Crudo a Nivel Mundial.
– Importante par los clientes que exportan y realizan sus negociaciones basados en ese precio.
– Unidad de Medida: $/qq

12
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3
Descripción de variables

Variables Externas…
• Mes Lluvioso
– Meses con los niveles más altos de precipitación en el año.
– Importante debido a que genera problemas de calidad y despachos.
– 1 = Lluvioso 0 = No Lluvioso
• Día de la Madre
– Mes en el que se celebra la festividad del día de la madre.
– Importante por que es una festividad en la que se incrementa el consumo de productos de
algunos de nuestros clientes, por ejemplo pasteles, chocolates, etc.
– 1 = mes de la madre 0= Resto de meses
• Semana Santa
– Mes en el que se celebró la semana santa.
– Importante por que se incrementa el consumo de productos de nuestros clientes y por el
feriado.
– 1 = mes de la semana santa 0=Resto de meses
• Navidad
– Mes en el que se celebra la Navidad
– Importante por que se incrementa el consumo de productos por las celebraciones.
– 1=Diciembre 0= Resto de Meses
13
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3
Descripción de variables
Variables externas
• Índice Actividad Económica
– Mide la evolución de la actividad económica mensual, toma en cuanta las diferentes
empresas del país.
– Es un reflejo del movimiento económico del país.
– Unidad de Medida: valor numérico que se obtiene del Banco de Guatemala
• Tipo de Cambio
– Se refiere al tipo de cambio promedio del mes, según el banco de Guatemala.
– Unidad de Medida: $/Q
• Año Electoral
– Año en que se elegirá a un nuevo Presidente.
– Importante por la cantidad de dinero circulante y las campañas de los candidatos.
– 1=Año Electoral 0=No año electoral
• Semanas al mes
– Numero de semanas que empiezan en lunes al mes.
– Importante debido al consumo de los segmentos grandes que se mide por semanas
– # de semanas
14
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3

Resumen de variables

15
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3

Identificación de variables con Stepwise 1

Las siguientes variables fueron significativas para explicar el comportamiento de la


demanda:
En algunos casos
las variables
explican hasta en
un 76% la
variabilidad de los
datos.

16
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3

Generación de las ecuaciones por Segmento - Producto

Ecuaciones
de
estimación
de la
Demanda de
cada
Segmento-
Producto

17
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3

Análisis comparativo abril

Se puede observar
que para uno de los
segmentos de
mayor volumen se
obtuvo un % de
Error muy bajo.

18
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3

Comparación de MSE para determinar el método final de cada segmento-producto

19
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 3

Modelo final de estimación de la demanda

• Se utilizará una combinación entre los métodos basados en los datos históricos y las
variables encontradas.
• Se utilizará el método descrito en la diapositiva anterior para cada segmento- producto y
se ajustará según la ecuación encontrada, por ejemplo:

Sacos=8205.15+77536.63(Escasez Estándar)
• Sabemos, por el análisis de variables, que al Embotellador-Refinada le afecta si hay
escasez de estándar.
• Por lo que de haber escasez, se le tendría que sumar al pronóstico 77,536.63 sacos.
• Es necesario evaluar constantemente los métodos seleccionados y variables para
asegurar que están dando los mejores resultados.
• También es muy importante tener en cuenta y evaluar los datos atípicos que nos pueden
afectar nuestros pronósticos.

20
El modelo de Regresión
Aplicaciones del modelo de regresión – Caso 2
Nivel o jerarquía del pronóstico

21
Modelos de regresión simple y múltiple

Regresión Lineal Simple

Intercepto con el
eje de las “y” o
valor constante
Error de
de la ecuación
estimación

E ( y / x) = a + b1 x + 
Cuál es el valor
Esperado de la Pendiente o
variable “y”, dado razón de cambio
una variable “x” de la ecuación

22
Modelos de regresión simple y múltiple

Regresión Lineal Simple


Función objetivo: Minimizar la Suma de
cuadrados de los errores (Ec. 1):
y
n n

  i
Error i (Ei)
 = ( y −i
2
a − b x
1 i ) 2

i =1 i =1
Ventas

Línea de regresión
(Línea que pasa por la 𝑌෠ = 𝑎ො + 𝑏෠1 𝑥 + e
mayoría de los puntos)

Figura 1 Diagrama de dispersión Publicidad


x

Francis Galton (1822 – 1911) produjo más de 340 artículos y libros. Creó el concepto
estadístico de correlación y regresión hacia la media, altamente promovido en el estudio
de variables.
23
Modelos de regresión simple y múltiple

Regresión Lineal Simple


Función objetivo: Minimizar la Suma de
cuadrados de los errores (Ec. 1):

n n

  i
y
 = ( y −
i
2
a − b x
1 i ) 2

i =1 i =1

Ventas

¿Cuál línea es?

Publicidad
Figura 1 Diagrama de dispersión x

24
Modelos de regresión simple y múltiple

Estimadores de mínimos cuadrados

Derivando la Ec. 1 se obtiene:


n

1) Estimador de mínimos  y (x − x)
i i
bˆ1 =
Yˆ = aˆ + bˆ1 x
i =1
cuadrados de la pendiente n

 (x − x)
i =1
i
2

Ecuación de
regresión o de
estimación de la
2) Estimador de mínimos
cuadrados del intercepto
aˆ = y − bˆ1 x demanda

25
Modelos de regresión simple y múltiple

Diagrama de dispersión y ecuación de regresión

No. de Calorías =
-33,77 + 37,65( % de alcohol);

r2 = 0.83

¿Interpretación?

26
Modelos de regresión simple y múltiple

Diagrama de dispersión y ecuación de regresión

Precio =
20,16 + 11,61( % de alcohol);
r2 = 0.06
¿Interpretación?

27
Modelos de regresión simple y múltiple
Términos que debería saber (indicadores básicos) sobre el análisis y la ecuación de
Regresión
➢ Coeficiente de Determinación (r2)
r2 = Es la proporción, de la variación de la Variable Dependiente, que 𝑟 2 = 𝑆𝑆𝑅/𝑆𝑆𝑇
es explicada por la(s) variable(s) independiente(s) r2 varía entre 0 y
1, entre más cerca de 1 mejor.

➢ Coeficiente de Correlación (r)


r = Mide el grado de correlación lineal entre dos variables, r varía
entre 0 y 1, entre más cerca de 1 mejor. 𝑟 = 𝑟2

➢ F – Valor (p-valor)
Medida que indica la significancia o confiabilidad de la ecuación de 𝐹 = 𝑀𝑆𝑅/𝑀𝑆𝐸
Regresión. Usualmente un valor más grande que 8 es aceptable.
8
➢ T – valor (p-valor)
Medida para la significancia o utilidad de las variables para
pronosticar. Usualmente un valor más grande que 2 o menor que
-2 es aceptable 𝑡 = 𝑏𝑘 /𝑆𝑏𝑘
-2s +2
s
28
Uso de Excel parar generar los modelos de
Regresión
Preparando Microsoft Excel para Análisis de Regresión

1. Archivo – Opciones – Complementos – Complementos de Excel


2. Seleccione “Herramientas para análisis” - [Aceptar]

3. Aparecerá en la barra de herramientas de Excel una opción para “Análisis de datos”

Análisis de datos

29
Uso de Excel parar generar los modelos de
Regresión

Preparando Microsoft Excel para Análisis de Regresión

4. Al seleccionar “Análisis de Datos (Data Analysis...) aparecerá la siguiente pantalla y


seleccionar regresión

30
Uso de Excel parar generar los modelos de
Regresión

Preparando Microsoft Excel para Análisis de Regresión

5. Si selecciona la opción de regresión la pantalla se muestra de la siguiente forma:

Aquí se da entrada la
columna de la variable
dependiente (Y)

Aquí se da entrada la
columna de la variable
independiente (X)

31
Métodos y pasos para la selección de variables

Modelos Descripción
1. Matriz de Se busca eliminar aquellas variables independientes que tengan alta
correlación correlación entre sí (más del 60%), y dejar aquellas que tengan alta
correlación con la variable dependiente.
2. Significancia de la Eliminar en forma progresiva (una por una) aquellas variables que no sean
variables significativas o menores que 2 y -2.
3. Regresión hacia Eliminar aquellas variables cuya presencia no mejora la calidad del modelo
atrás según el criterio especificado.
4. Regresión hacia Iniciar con una sola variable independiente e ir añadiendo aquellas variables
adelante e interacciones que mejoran significativamente el modelo.
5. Todas la Probar todas la combinaciones de las variables.
regresiones
posibles
6. Stepwise Reconsiderar mantener las variables que ya se habían añadido previamente.
(Regresión paso a Es decir que no sólo puede entrar una nueva variable en cada paso sino que
paso) puede salir alguna de las que ya estaban en la ecuación. El proceso finaliza
cuando ninguna variable de las que no están en la ecuación cumple la
condición para entrar, y de las incorporadas a la ecuación ninguna cumple la
32 condición para salir.
Uso de Excel para la selección de variables

Actividad 1.

Utilice la información de la Regresión Coca Cola. XLS para:

a. Generar el Análisis de Regresión (Excel) para probar los métodos 1, 2 y 3


de selección de variables.
b. Generar un reporte de los elementos estadísticos principales que se
producen con sus respectivas interpretaciones, tales como:
1. R2
2. Ecuación que pronostica las ventas y su validez estadística (F)
3. Importancia o significancia de las variables seleccionadas (t)
4. Matriz de correlación final.
c. Describir sus conclusiones finales.

33 Métodos Avanzados | Online


Fin sesión 4

www.tomgalvez.com Tel (81) 2265 3783 Twiter: Galveztom

Pronósticos, Planeación y S&OP 34

También podría gustarte