Está en la página 1de 32

Regresión Lineal

Motivación
Hasta el momento hemos visto cómo de una muestra
podemos inferir información sobre una población.

Ahora analizaremos ¿cómo el comportamiento de una o


más variables afecta el comportamiento de la variable de
interés?

Al responder lo anterior se obtiene:

1. Interpretar como a partir del comportamiento de una


variable se puede explicar el comportamiento de otra.
TEXTOS PARA
2. Predecir futuros comportamientos de una variable.
SEPARADORES
**Recuerde que esto es para variables independientes en el
tiempo, independientes entre ellas y continuas.
Ejemplo
Sabemos que las ventas aumentan mientras más se
invierta en publicidad, pero ¿cómo explica el nivel de
inversión de publicidad, el nivel de ventas?

¿Será que el tiempo que el señor con el trapo afuera de


mi restaurante explica mis ventas? (Interpretación)

Si quiero llegar a cierto nivel de ingresos, ¿cuánto debo


invertir en letreros en la calle? (Predicción)

Ejemplo
¿Cuanto será la demanda de pañales el próximo
mes? (Predicción)

¿Si tendré 40 mil clientes, gastaré 100 millones en


publicidad y 30 millones de multa por
contaminación ambiental, cuanto será la ganancia
del próximo mes? (Predicción)

¿Cómo explica el valor de multas las ganancias?


(Interpretación)
Analicemos un contexto de su interés.

Liste las variables relevantes para su contexto. De ellas, seleccione aquella que es de su interés estudiar.

TEXTOS PARA
De la lista anterior seleccione dos variables que usted considera tienen mayor relación con la variable de

SEPARADORES
interés elegida. Enuncie verbalmente estas relaciones.

¿Cuál seria la variable dependiente y cuál la independiente?

¿Qué información usaría para predecir el comportamiento de su variable de interés?


¿Cuál es el valor de su variable dependiente si todas sus
variables independientes valen 0?
¿Cómo afecta la variable independiente a la dependiente?
En su contexto
¿Cuántas variables necesito para poder explicar mi variable
planteado independiente?
encuentre: ¿Qué significa que una variable no afecte a la otra?

Extienda el ¿Si tuviera acceso al valor de las variables independientes,


podría establecer el valor de la dependiente?
contexto y de
¿Cómo compruebo que el proceso es el correcto?
respuesta a lo
siguiente (15 min). ¿Qué tan bueno es mi modelo?

¿Cómo se deberían comportar mis datos?


25000 7000000

20000 6000000

15000
5000000

10000
4000000

5000
3000000
0
-400 -300 -200 -100 0 100 200 300 400
2000000
-5000

1000000
-10000

0
-15000 -400 -300 -200 -100 0 100 200 300 400

1500000000 600

1000000000 500

400
500000000

300
0
-400 -300 -200 -100 0 100 200 300 400

200
-500000000

100
-1000000000

0
-1500000000 -400 -300 -200 -100 0 100 200 300 400
Regresión: Retrocesión o acción de
volver hacia atrás (RAE).

Se toman datos del pasado, para


predecir el futuro.
Definición de
Regresión Lineal Lineal: perteneciente o relativo a la línea
(RAE).

El efecto de las variables el lineal. Tienen


un efecto proporcional la una con la otra.
En estadística la regresión lineal o ajuste lineal es
un modelo matemático usado para aproximar la
relación de dependencia entre una variable
Regresión dependiente Y con las variables independientes X i.

Lineal Donde Y es la variable dependiente: depende de


las otras variables.

Xi es cada una de las variables Independientes:


cada i diferente es una variable diferente que
toma un valor sin “depender” de las demás.
Y Lineal Y Lineal
300
25000

250 20000

200 15000

150 10000

100 5000

50 0
-400 -300 -200 -100 0 100 200 300 400

-400 -300 -200 -100


0
0 100 200 300 400
-5000

-50 -10000

-100 -15000
¿Cuál es el valor de su variable dependiente si todas sus
variables independientes valen 0? 𝛽0
¿Cómo afecta la variable independiente a la dependiente?
𝛽𝑖
¿Cuántas variables necesito para poder explicar mi P
variable independiente?

¿Qué significa que una variable no afecte a la otra?


𝛽 𝑖= 0
Respuestas ¿Si tuviera acceso al valor de las variables independientes, Predicción
podría establecer el valor de la dependiente?

¿Cómo compruebo que el proceso es el correcto? Errores y


supuestos
2 2
𝑅 𝑦 𝑅 𝐴𝑗𝑢𝑠𝑡𝑎𝑑𝑜
¿Qué tan bueno es mi modelo?

¿Cómo se deberían comportar mis datos? Supuestos


Y Lineal
25000

20000

15000

10000

5000

0
-400 -300 -200 -100 0 100 200 300 400

-5000

-10000

-15000
Y Lineal
Línea café: Modelo Estimado
25000

Línea roja: Modelo Ideal


20000

15000

10000

5000

0
-400 -300 -200 -100 0 100 200 300 400

-5000

-10000

-15000
Puede usar Excel o R para desarrollar el
Ejemplo ejemplo práctico propuesto.

Práctico A continuación video guía de Excel


https://www.youtube.com/watch?v=RnKowBs
V1nw
Excel Mes
1
Ventas (millones) Compradores mayoristas Inversiones (Millones)
$ 1.583,23 29 27,02
2 $ 2.051,45 17 62,92
3 $ 2.004,91 22 77,75
4 $ 2.154,84 18 84,43
5 $ 1.564,35 10 27,5

Datos

Análisis de Datos

Regresión

18
Excel
En rango Y de entrada seleccione los datos de su
variable Dependiente.

En rango X de entrada seleccione los datos de todas


sus variables Independientes.

Seleccione Rótulos si en su primera fila seleccionada


ha escogido el nombre de las variables (aconsejado).

Seleccione el nivel de confianza de los intervalos.

Seleccione Constante igual a cero si en su modelo la


constante es cero.

Seleccione la Opción de salida de su agrado.

Seleccione las otras opciones que desee.


19
Resultados Estadísticas de la regresión
Arrojados Coeficiente de correlación múltiple 0,822593914
por Excel Coeficiente de determinación R^2 0,676660748
R^2 ajustado 0,669993959
Error típico 308,6153662
Observaciones 100
R2 :  índice que puede utilizarse para medir el grado de relación de las variables siempre y cuando ambas sean
cuantitativas y continuas. Toma valores entre 0 y 1, donde 0 representa que las variables Independientes explican el 0%
de la variable Dependiente; mientras que, 1 representa que la variable Dependiente es explicada en un 100% por las
variables Independientes.

R2 tiende a estimar de forma optimista el ajuste de la regresión lineal. Siempre aumenta como el número de efectos (de
variables) que se incluyen en el modelo. R2 ajustado intenta corregir esta estimación excesiva. R2 ajustado podría
disminuir si un efecto específico no mejora el modelo. R2 ajustado es un medida de bondad de ajuste corregida (precisión
de modelo) para los modelos lineales. Identifica el porcentaje de varianza en el campo objetivo que se explica mediante la
entrada o entradas.

R2 ajustado siempre es menor o igual que R2. Un valor de 1 indica un modelo que predice perfectamente valores del
campo objetivo. Un valor que es menor o igual que 0 indica un modelo que no tiene ningún valor predictivo. En el mundo
real, R2 ajustado se encuentra entre estos valores. 20
Resultados
Arrojados
por Excel
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 19333896,17 9666948,086 101,4972543 1,65361E-24
Residuos 97 9238614,095 95243,44427
Total 99 28572510,27

Suma de cuadrados de la Regresión.

Suma de cuadrados de los Residuos

Suma de Cuadrados Total

Valor del estadístico de prueba F para la prueba de significancia global

Valor P o P-Value de la prueba de significancia global.

21
Resultados
Arrojados
por Excel
Coeficientes Error típico Estadístico t Probabilidad
Intercepción 383,0245139 132,691137 2,886587022 0,004800909
Compradores mayoristas 30,76698505 4,904191326 6,273610266 9,84979E-09
Inversiones (Millones) 15,86158371 1,212197177 13,08498651 3,79583E-23

Coeficientes: Betas estimados por le modelos de la regresión lineal correspondientes a cada una de las
variables.

Estadístico t : Estadístico de prueba para la prueba de significancia individual.

Probabilidad: 2 veces el Valor P o P-Value de la prueba de significancia individual.

22
Resultados
Arrojados
por Excel

… Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%


Intercepción … 119,6693378 646,37969 119,6693378 646,37969
Compradores mayoristas … 21,03352282 40,50044728 21,03352282 40,50044728
Inversiones (Millones) … 13,45570787 18,26745955 13,45570787 18,26745955

Intervalo de confianza del 95% por defecto para cada una de las estimaciones de los betas.

Intervalo de confianza de la confianza especificada en las opciones para cada una de las estimaciones de los
betas.

23
Ejemplo
Descargue en Moodle el la base datos.
Práctico
Puede usar Excel o R para desarrollar el
ejemplo práctico propuesto.
Tiene usted una base de datos de su Cine, del cual es
dueño. Se desea conocer si las ventas se ven afectadas
por la condición de las máquinas, limpieza de las
REGRESIÓN LINEAL instalaciones, inversión publicidad, mala condición del
clima, tiempo de cortos comerciales, precios.

Los clientes evaluán los anteriores aspectos en las


siguientes escalas:
CASO DE ESTUDIO: Condición de las máquinas 0 a 100%
Limpieza de las instalaciones de 0 a 10.
CINE
A partir de la base de datos, construya un modelo de
regresión lineal para la variable ventas.
Use la regresión lineal construida para:
REGRESIÓN LINEAL Conocer el efecto de cada una de sus variables sobre la
variable ventas.

¿Hay variables que no tienen relación significativa?

CASO DE ESTUDIO: Si sus maquinas se encuentran a un 80%, su limpieza


en un puntaje de 5, invirtió 100 millones en publicidad,
en la escala de mal tiempo hay un 5, tiene un precio de
CINE
20 mil la confitería y 20 minutos de comerciales.
¿Cuanto espera que sean sus ventas?
¿Cuál es el valor de su variable dependiente si todas sus
variables independientes valen 0?
¿Cómo afecta la variable independiente a la dependiente?

¿Cuántas variables necesito para poder explicar mi variable


independiente?

Responda las ¿Qué significa que una variable no afecte a la otra?

preguntas en el ¿Si tuviera acceso al valor de las variables independientes,


nuevo contexto. podría establecer el valor de la dependiente?
¿Cómo compruebo que el proceso es el correcto?

¿Qué tan bueno es mi modelo?

¿Cómo se deberían comportar mis datos?


Prueba de Hipótesis
H 1 : 𝐸𝑥𝑖𝑠𝑡𝑒𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 𝛽 𝑖 ≠ 0
Significancia
GLOBAL

Prueba F de cola derecha.

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 19333896,17 9666948,086 101,4972543 1,65361E-24
Residuos 97 9238614,095 95243,44427
Total 99 28572510,27
H 0 : 𝛽 𝑖=0
Prueba de Hipótesis
H 1 : 𝛽𝑖 ≠ 0
Significancia
INDIVIDUAL

Prueba t a dos colas

Coeficientes Error típico Estadístico t Probabilidad


Intercepción 383,0245139 132,691137 2,886587022 0,004800909
Compradores mayoristas 30,76698505 4,904191326 6,273610266 9,84979E-09
Inversiones (Millones) 15,86158371 1,212197177 13,08498651 3,79583E-23
REALICE, EN GRUPOS DE 3,
UN ESQUEMA DE COMO
REALIZAR UNA REGRESIÓN
LINEAL
Libros Guía

En el curso maestro encontrará los siguientes libros:

Estadística para Administración y Economía. Sexta


Edición. Paul Newbold, William Berry.

Probabilidad y estadística para ingeniería y ciencias.


Novena Edición. Walpole, Myers, Myers.
TEXTOS PARA
En el programa se especifican lecturas complementarias.
SEPARADORES
GRACIAS

También podría gustarte